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(57) Abstract 



The invention concerns a genomic retroviral nucleic material, in isolated or purified state, at least partially functional or non-functional, 
whereof the genome comprises a reference nucleotide sequence selected from the group including sequences SEQ ID N**^: 1 to 15, their 
complementary sequences, and their equivalent sequences, in particular the nucleotide sequences having, for every series of 100 contiguous 
monomers, at least 70 % and preferably at least 90 % homology with said sequences SEQ ID N^^: 1 to 15. The invention also concerns 
the application of said material. 

(57) Abr^g^ 

L' invention conccme un materiel nucl^ique de type gdnomique retroviral. ^ Tdtat isol6 ou purifi6. au moins partiellement fonctiormel 
ou non fonctionnel, dont le g6nome comprend une sequence nucl66otidique de r6f6rence choisie dans le groupe incluant les s6quences SEQ 
ID NOs: 1 ^ 15, leurs sdquences compl6mentaires, et leurs sequences 6quivalentes, notamment les sequences nucldotidiques prdsentant, 
pour toute suite de 100 monomferes contigus. au moins 70 % et pr6f6rentiellement au moins 90 % d*homologie avec respectivement lesdites 
sequences SEQ ID NOs: 1 h. 15; et les applications de ce materiel. 
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SEQUENCES RETRO VIRAUX ENDOGENES, ASSOCIEES A DES MALADIES AUTO-IMMUNES 
ET/OU A DES PERTURBATIONS DE LA GROSSESSE 



5 La presente invention concerne un nouveau materiel 

nucleique, de type genomique retroviral endogene, 
differents fragments nucleotidiques qui le comprennent ou 
qui sont obtenus a partir dudit materiel, ainsi que leur 
utilisation pour marquer au moins una maladie auto-immune, 

10 ou une pathologie qui lui est associee, une grossesse 
pathologique ou un insucces de grossesse. 

Le criblage de la banque d*ADNc a I'aide de la 
sonde Ppol-MSRV (SEQ ID NO: 29) a permis de detecter des 
clones chevauchant permettant la reconstruction d'un ARN 

15 genomique putatif de 7582 nucleotides, - Par sequence 
reconstruite, on entend la sequence deduite de 
I'alignement des clones chevauchants Get ARN genomique 

presente la structure R-U5-gag-pol-env-U3-R. Une 
interrogation "blastn" sur plusieurs bases de donnees, a 

20 I'aide du genome reconstruit, montre qu»il existe une 
quantite importante de sequences genomiques (ADN) 
apparentees dans le genome humain. Environ 4 00 sequences 
ont ete identifiees dans GenBank (cf figure 3) et plus de 
200 sequences dans la banque EST (Expressed Sequence Tag) , 

25 la plupart en antisens. Ces sequences sont trouvees sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 
16, 21, 22, X, avec une forte concentration apparente de 
LTR sur le chromosome X. 

La sequence reconstruite (ARNm) est contenue 

30 integralement a 1 • interieur du clone genomique RG083M05 
(gb AC00064) (9,6 kb) , et presente une similitude de 96% 
avec deux regions discontinues de ce clone qui contient 
egalement des regions repetees a chaque extremite. 
L'alignement des sequences experimentales correspondant 

35 aux regions 5' et 3' de I'ARN genomique reconstruit avec 
I'ADN du clone RG083M05 a permis de deduire une sequence 
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I.TR St d-idantifier des 61^ments caract^ristiques dss 
r»trovirus „otan»ent ceux in,pU,u6= dans la tran.cript.cn 
inverse, » savcir Xe PBS (Pri.er Binding Site, en aval du 
LTR 5- et le PPT (PolyPurlne Tract) en aK,ont du LTR 3 . On 
S cbserve <^e I'.l^-nt U3 est extr.^e.ent court en 
co„paraison de celui observ. che. les r*trovxrus de type C 
des ma^ifSres, et comparable en taille a la "^-^ °^ 
,.„4rale.ent d.crite che. les retrovirus de type D et les 
Ltrovirus aviaires. La region PBS est homologue au PBS 
.0 des retrovirus aviaires. sug,.rant !■ utilisation du 
tBHA-rrP co«.e amorce pour la transcription inverse. Par 
consequent, cette nouvelle tamille de HERV est nommee 
HERV-W (Human Endogenous Retrovirus) . 

L-analyse phylog^nique dans la region pol a montre 
15 qua la famille HERV-W ' est phylogSniquement 

lamilles ERV-. ■ et RTV. H et aPP-ie;t ;onc ; la ami le 
des retrovirus endogenes de type i. ^ 

^ la traitie de lecture ouverte (ORF) de env 

Torer-eTla ^^^^7 procne des retrovirus simiens de 
.0 type D et des retrovirus de la reticuloendotheliose 
tvfaire que des retrovirus ma»mi£eres de type C. suggerant 
une structure de genome chlmerique C/D. 

Les arbres phylogeniques. supportes par des hautes 
valeurs de "bootstrap" montrent que les families ERV-9 et 
valeurs a „.aues d' insertions independantes . 

HERV-W derivent de deux vaques a in .^.m. 
Ainsi, le(s) eiement(s) acti£(s) a I'origine de la famille 
^^V.; est (sont) distinct (s) de celui (ceux, 
ZIes,quel(s) la famille ERV-9 derive. De plus, le PBS de 
TeRV-w ttlliie probablement un tRHA-p alors que BRV-, 
30 utilise proba^lement un^t^.*'^.- ^^^^^^^ ^^^^ 

exprimes dans'le placenta, alors qu-on ne detecte pas les 
ARN ERV-9 dans ce tissu. 



25 



35 
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FONCTIONS BIOLOGIQUES DE HERV-W 

L' expression de HERV-W restreinte au placenta et 
la longue trame de lecture codant potentiellement pour une 
enveloppe r^trovirale autorisent a proposer des fonctions 
5 biologiques physiologiques dont 1' alteration pourrait etre 
associee a des pathologies. 

L* expression restreinte au placenta suggere que 
1' expression de genes retroviraux et/ou non retroviraux 
sous la dependance des LTR peut etre hormone-dependante. 
10 Ces genes peuvent etre adjacents, ou sous la dependance de 
LTR isoles. Une pathologie peut alors provenir d'une 
expression aberrante suite a la reactivation d'un LTR 
silencieux par divers facteurs : infection virale (par 
exemple par un membre de la famille des Herpesvirus) ou 
15 activation immune locale. Un polymorphisme au niveau des 
LTR pourrait aussi favoriser ces evenements. 

L' enveloppe de HERV-W pourrait jouer un role 
fusogenique, en particulier au niveau de sous-types 
cellulaires du placenta. Le peptide immunosuppresseur de 

2 0 cette enveloppe pourrait proteger le foetus contre 

1' agression du systeme immunitaire maternel. Enfin, par un 
mecanisme de saturation de recepteurs, 1' enveloppe de 
HERV-W pourrait jouer un role protecteur contre les 
infections retrovirales exogenes . L' alteration de 

25 1 • immunite cellulaire locale peut decouler d'un signal 
immunostimulateur porte par 1' enveloppe. Get effet peut 
etre lie a une region portant une activite superantigene, 
ou a la region immunosuppressive qui deviendrait 
immunostimulatrice a la suite, soit d'un polymorphisme, 

30 soit d'un effet-dose (surexpression) . 

La verification de ces implications et la 
comprehension des consequences liees a une alteration des 
fonctions biologiques des LTR ou de 1' enveloppe 
retrovirale endogenes peut mener a 1 ' etablissement de 

3 5 methodes de diagnostic ou de suivi : 
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a. ,rossesse, ^^^^^^^^ ,„,,.„s cobbs la sclerose en 

pxa^.s ou la poXvar-.te -u^^^^^^^^^^^^ . ... 

Con.™nt a .a p ^^^^^^^ ^ 

ascouvert, a 1 etat e g ci-apr6s, ayant 

nuoUique, ^''P^""" . J^^^^s susceptible d'etre 

1. organisation ^•^.J^^^o-i^nnr... ou une patholoqie qui 
0 ruri:t\rso=:rr une .o.sesse pat.oloqique ou un 

^"^-^'^^ ::ttr,;uol.ique selon la pr.sente invention. 

.epr*sent. » la mure 1 et e t a ^^^^ ^^^^ 

15 et est repr.sente a la Fig 

genomique. retroviral", on entend 

par !• expression de tVP ^^^^^^ „„oWique 

Xa oaract4ristique selon ^-^u-"-^ n.cl.otldiques 
consider. ooBprend une » ^ _^;X,,„s, et/ou . ses 
ao apparent.es a ^ ' 

sequences f onotionnelles ou -"■'^^ _ s'apparente a 

ce materiel nucleique de i- expression 

retrovirus endog.ne --n des.n^ ^parj ^ P 

H^v-W. Kn ^IJ^^^^ ,„screening-.) de touts 

25 technique appropriee piaoentaire, comme Bontre 

-"-^ "-Tart^uUer aL des aBorces ou sondes 

ci-apres, en P-"=-^ ..nybrider avec tout ou 

nucieiques synthetisees po 

partle de SEQ ID no: 11. ^^^^^^^ .^element tout 

30 La presente inventi ^.^^ ^ ^ 

produit nucielque ou ^^^^IXl^^^Z^o. SB. xo NO: XI. 
du Baterlel nucieique de referenc^ 

^ 1. invention s'lnteresse P ^^^^^ 

alfferentes — ^3 produits derives, 
35 materiel nucltique P"^^""' ' ^ „ „„e pathologle qui 
avec toute maladie auto-immune et/o 
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5 

lui est assoclee, ainsi qu'avec des cas de grossesse 
pathologique ou d'insucces de grossesse. 

Par dite " auto- immune " , on entend notamment : 

- la sclerose en plaques 

5 - la polyarthrite rhumatoide 

- le lupus erythemateux dissemine 

- le diabete insulino-dependant 

- et/ou les pathologies qui leur sont associees. 



10 La presente invention concerne tout d'abord un 

materiel nucleique de type genomique retroviral, a 1 • etat 
isole ou purifie, au moins partiellement fonctionnel ou 
non fonctionnel. 

Ce materiel est caracterise en ce que son genome 

15 comprend une sequence nucleotidique de reference choisie 
dans le groupe incluant les sequences SEQ ID NOs: 1 a 15, 
leurs sequences complementaires , et leurs sequences 
equivalentes , notamment les sequences nucleotidiques 
presentant, pour toute suite de 100 monomeres contigus, au 

20 moins 50% et pref erentiellement au moins 70%, par exemple 
au moins 90% d'homologie avec respectivement lesdites 
sequences SEQ ID NOs: 1 a 15. 

Ce materiel est egalement caracterise en ce que 
son genome comprend une sequence nucleotidique de 

25 reference, codant pour tout polypeptide presentant, pour 
toute suite contigiie d'au moins 3 0 acides amines, au moins 
50%, et de preference au moins 70% d'homologie avec une 
sequence peptidique susceptible d'etre codee par au moins 
une partie f onctionnelle de la sequence nucleotidique de 

30 reference telle que definie ci-dessus. 

A titre particulier, ce materiel comprend un 
fragment nucleique insere entre deux sequences 
correspondant respectivement a la region LTR et au gene 
gag de la structure genomique retrovirale, notamment un 

35 fragment nucleique constitue par ou comprenant la sequence 
SEQ ID NO: 12. 
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I., invention concerne aussi un matSriel nucISique 
ae type retroviral soue-g6nomigue , constitu^ par une 
stquence nu=l»otiaique iae„ti,ue » SEQ ID NO: 11 avec une 
a414tion tel qu-exe.plif 1* par les clones =1.PH74 
<SEQIDN0=7,. C1.PH7 (SEQ ID NO: 8, et cl^PiST 
(SEQ ID no: 9) , cette WWtion resultant ou non d une 

strateqie d'epissage- 

materiel nucl^ique pr^c^de«.ment definx coxaprend 
au moins une sequence nucleotidique fonctionnelle codant 
pour au K.oins une prot.ine r.trovirale, et/ou au .oxns une 
sequence nucleotidique de regulation. 

invention concerne ensuite tout fragment 
nucleotidique d'au moins 100 bases, comprenant une 
sequence nucleotidique choisie dans le groupe coxnprenant 

'"a) toutes les sequences nucl^otidiques, partxelles 
et totales d'un materiel nucleique tel que defxnx 
precedemment^^^^^^ les sequences nucleotidiques , partielles 
et totales d'un clone choisi dans le groupe incluant les 
clones : 

- C1.6A2 (SEQ ID no: 1) 

- C1.6A1 (SEQ ID no: 2) 

- C1.7A16 (SEQ ID NO: 3) 

- cl.Pi22 (SEQ ID NO: 4) 
5 - cl.24.4 (SEQ ID NO: 5) 

- C1.C4C5 (SEQ ID NO: 6) 

- C1.PH74 (SEQ ID NO: 7) 

- C1.PH7 (SEQ ID no: 8) 

- cl.Pi5T (SEQ ID NO: 9) 

0 - cl.44.4 (SEQ ID NO: 10) 

- HERV-W (SEQ ID NO: 11) 

- C1.6A5 (SEQ ID NO: 12) 

- C1.7A20 (SEQ ID NO: 13) 

- C1.7A21 (SEQ ID NO: 14) 
j5 - LTR (SEQ ID NO: 15) 
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c) les sequences respectivement complement a ires 
aux sequences selon a) at b) 

d) les sequences respectivement equivalentes aux 
sequences selon a) a c) , notamment les sequences 

5 nucleotidiques presentant, pour toute suite de 100 
monomeres contigus, au moins 50%, et de preference au 
moins 70%, ou mieux au moins 80 %, par exemple au moins 
90% d^homologie avec les sequences a) a c) . 

L' invention concerne aussi toute sonde nucleique 

10 de detection d'un materiel nucleique, insere ou non dans 
un acide nucleique, caracterisee en ce qu'elle est 
susceptible de s'hybrider specif iquement sur un materiel 
nucleique, tel que defini precedemment . 

Une telle sonde comprend ou non un marqueur. 

15 L* invention concerne aussi une amorce nucleique 

pour 1 ' amplification par polymerisation d'un ARN ou d'un 
ADN, caracterisee en ce qu'elle comprend une sequence 
nucleotidique susceptible de s'hybrider specif iquement sur 
un materiel nucleique ou un fragment nucleique, tel que 

20 defini precedemment. 

A titre d' exemple, une sonde nucleique ou amorce 
nucleique selon 1' invention est caracterisee en ce qu'elle 
est constitute par une sequence nucleotidique choisie dans 
le groupe incluant SEQ ID NOs: 16 a 28. 

25 L' invention concerne aussi tout ARN ou ADN, et 

notamment un vecteur de replication, comprenant un 
fracfment nucleotidique, tel que defini precedemment. 

L* invention concerne aussi tout peptide code par 
tout cadre de lecture ouvert appar tenant a un fragment 

3 0 nucleotidique, tel que defini precedemment, notamment 
polypeptide, par exemple oligopeptide formant un 
determinant antigenique reconnu par des sera de patients 
affectes par une maladie auto-immune, ou une pathologie 
qui lui est associee, ou de patientes ayant une grossesse 

3 5 pathologique ou un insucces de grossesse. 
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8 

un 



10 



A tl«s d- temple, o« polypeptide est cod* par 
.r.g»ent nuol*otidi,ue oo.pren.nt un cadre de lect..e 
ouvfrrcodant pour une ou des prot*ine. E.V retrov.rales . 
Fnfin 1' invention concerns : 

l";iUsation d.un materiel nucl^ique. ou d-un 

!!,n. „aladie auto-immune ou d'une pathologie qui lur est 
d'une maladie au ,.k„i„„i„ue ou d'insucces de 

associee, de grossesse pathologique 

^™'lVutilisation d.un materiel nucl.ique, ou d-un 
fragment nucl.otidi.ue. tels ,ue 

oomme marqueur '^"^'ZJ'Z^^^^ - 

!e ie ue d.une grossesse pat.o,ogigue ou 

15 associee, ou a un zxosi 

^^^^^J^J^::„ nuci.igue, ou d-un 

aue definis precedemment , 
fragment nucl.otxd.que ^^^^^^^ 3usceptibilite . 

comme marqueur de proxxm.te d un ^^"^ 
une maladie auto-immune ou . una "^^^-^f 
associSe, ou It un risque d'une grossesse patholog 

d.un insuco6s de grossesse. ^arguage 
L. invention oonoerne aussi un pro 

r, „,l,die auto-immune ou d.une pathologie 
„ol4culaire d.une malad.e aut p,^^„i„,lgue ou 

" -\ r;™; .r^^^Lis. en ce qu.on identifie 

d.insuccesde grossesse ^^^^^^^ .iologique corporel, 

et/ou quantlfie dans t £„g,ent nucl4otidique , 

notamment fluide corporel ""'^ J 
tel que dfefini prScSdemment , solt sous 

30 sous forme d'ADN. _ prooMi, on 

1 titre d.exemple, selon un tei p 
dans ledit materiel biologique corporel, des 
tritries :::ri:ant un fragment nucUotidique, tel que 
«fi„l P-*cW;™-- application diagnostigue 

" et/ou tniaprtique d.un mat.riel nucUigue. d.un fragment 



20 
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nucleotidique ou d'un peptide defini ci-dessus, et en 
cela, un autre objet de 1 ' invention est une composition 
diagnostique ou une composition therapeutique comprenant 
undit materiel, undit fragment ou undit peptide. 

5 

Avant de detainer 1» invention, differents termes 
utilises dans la description et les revendications sont a 
present definis: 

- par virus humain, on entend un virus susceptible 
10 d'infecter ou d'etre heberge par I'etre humain, 

- compte tenu de toutes les variations et/ou 
recombinaisons naturelles ou induites, pouvant etre 
rencontrees dans la pratique de la presente invention, les 
Ob jets de cette derniere, definis ci-dessus et dans les 

15 revendications, ont ete exprimes en comprenant les 
equivalents ou derives des differents materiels 
biologiques definis ci-apres, notamment les sequences 
homologues nucleotidiques ou peptidiques, 

- le variant d'un virus ou d'un agent pathogene 
20 et/ou infectant selon 1* invention comprend au moins un 

antigene reconnu par au moins un anticorps dirige centre 
au moins un antigene correspondant dudit virus et/ou dudit 
agent pathogene et/ou infectant, et/ou un genome dont 
toute partie est detectee par au moins une sonde 

25 d 'hybridation, et/ou au moins une amorce d ' amplification 
nucleotidique specifique dudit virus et/ou agent pathogene 
et/ou infectant, notamment un genome appartenant a la 
famine HERV-W, dans des conditions d ' hybridation 
determinees bien connues de I'homme de I'art, 

30 - selon 1' invention, un fragment nucleotidique ou 

un oligonucleotide ou un polynucleotide est un 
enchalnement de monomeres, ou un biopolymere, caracterise 
par la sequence, inf ormationnelle ou non, des acides 
nucleiques naturels, susceptible de s'hybrider a tout 

35 autre fragment nucleotidique dans des conditions 
predeterminees, 1 ' enchalnement pouvant contenir des 
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.onoBires d. structures chi-niques dxfferentes at etre 
obtenu a partir d'une -ol.cule d'acide nucleiqus naturelle 
et/ou par recomblnaison gSnStique et/ou par synthese 
ohimique , un fragment nuclSotldique peut 6tre identique a 
cnimique , 414»,ent de la famine HEEV-W 

5 un fragment gSnomique d'un element as ± 

c=nsid»r4 par la presents invention, notamment un gene de 
ce dernier, par exemple pol ou env dans le cas dud.t 

element ; -,-^4.^^^ 
- ainsi un monomfere peut 6tre un nucleotide 

10 naturel d-acide nucUlque, dont les .laments constitutifs 
sont un Sucre, un groupement phosphate et une base azotee; 
dans le sucre est le ribose. dans l-ADN le 

la d4soxy-2-ribose; selon qu'll s'agit de I'ADN ou I'ARK, 
la base a.otSe est choisle parmi 1' adenine, la guanine 
15 I'uracile, ^a cytosina, la thymine; ou le nucleotide peut 
.tra modifi* dans Lun au moins das tro.s elements 
constitutifs ; a titre d'exemple, la modification paut 
intarvenir au niveau des bases, gSn^rant J'^^^ 
modifi^ee talles que I'inosine, la methyl-5- 

la desoxyuridine, J-a 

dimithylamino-5-desoxyuridine, la diamino-2 , 6-purina la 
bromo-s-d^scxyuridine at touta autre base modifiae 
fevorisant 1' hybridation, au niveau du Sucre, la 
modification peut conslster dans le remplacement d au 
25 moins un dSsoxyribose par un polyamide, et au niveau du 
groupement phosphate, la modification peut consister dans 
!on remplacement par das esters, notamment choisis parmi 
les esters de diphosphate, d'alkyl et arylphosphonata at 

de phosphorothioate, ^ 4-4„„^ 

30 _ par "fonctionnel", on entend la caracterxstxque 

selon laquelle une sequence nucleotidique, un mater xel 
nucleique, ou un fragment nucleotidique coraprend une une 
sequence inf ormationnelle" , 

- par "Sequence inf ormationnelle" , on entend toute 
suite ordonn^e de monomeres, dont la nature chimique et 
l.ordre dans un sens de r.f.rence, constituent ou non une 



35 
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information f onctionnelle de meme qualite que celle des 
acides nucleiques naturels, par exemple une trame de 
lecture. codant pour une proteine, une sequence 
regulatrice, un site d'epissage, un site de recombinaison . 
5 - par hybridation, on entend le processus au cours 

duquel, dans des conditions operatoires appropriees, 
notamment de stringence, deux fragments nucleotidiques, 
ayant des sequences suffisamment complementaires, 
s'apparient pour former une structure complexe, notamment 
10 double ou triple, de preference sous forme d'helice, 

- une sonde comprend un fragment nucleotidique 
synthetise notamment par voie chimique ou polymerisation, 
ou obtenu par digestion ou coupure enzymatique d'un 
fragment nucleotidique plus long, comprenant au moins six 

15 monomeres, avantageusement de 10 a 100 monomeres, de 
preference 10 a 30 monomeres, et possedant une specif icite 
d' hybridation dans des conditions determinees ; de 
preference, une sonde possedant moins de 10 monomeres 
n'est pas utilisee seule, mais I'est en presence d'autres 

20 sondes de taille aussi courte ou non ; dans certaines 
conditions particulieres, il peut etre utile d'utiliser 
des sondes de taille superieure a 100 monomeres ; une 
sonde peut notamment etre utilisee a des fins de 
diagnostic et il s'agira par exemple de sondes de capture 

25 et/ou de detection, 

- la sonde de capture peut etre immobilisee sur un 
support solide par tout moyen approprie, c'est-a-dire 
directement ou indirectement , par exemple par covalence ou 
adsorption passive, 

3 0 - la sonde de detection peut etre marquee au moyen 

d'un marqueur choisi notamment parmi les isotopes 
radioactifs, des enzymes notamment choisis parmi la 
peroxydase et la phosphatase alcaline et ceux susceptibles 
d*hydrolyser un substrat chromogene, fluorigene ou 

35 luminescent, des composes chimiques chromophores , des 
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composes chromogenes, fluorig&nes ou luminescents , des 
analogues de bases nucl§otidiques , et la biotine, 

- les sondes utilisees a des fins de diagnostic de 
1. invention peuvent etre mises en oeuvre dans toutes les 
5 techniques d- hybridation connues de I'homme de I'art, et 
notaxroaent les techniques dites "DOT-BLOT", "SOUTHERN 
BLOT", "NORTHERN BLOT" qui est une technique identxque a 
la technique "SOUTHERN BLOT" mais qui utilise de I'ARN 
comine cible, la technique SANDWICH; avantageusement , on 
10 utilise la technique SANDWICH dans la presents invention, 
comprenant une sonde de capture specifique et/ou une sonde 
de detection specifique, fetant entendu que la sonde de 
capture et la sonde de detection doivent presenter une 
sequence nucl^otidique au moins partiellement diff^rente, 
15 - toute sonde selon la presente invention peut 

s-hybrider in vivo ou in vitro sur I'ARN et/ou sur I'ADN, 
pour bloquer les phenomenes de replication, notamment 
traduction et/ou transcription, et/ou pour degrader ledxt 
ADN et/ou ARN, 

20 - une amorce est une sonde comprenant au moins six 

monom^res, et avantageusement de 10 a 30 monomeres, 
possedant une spfecificite d - hybridation dans des 
conditions d^terminees, pour 1- initiation d'une 
polymerisation enzymatique, par exemple dans une technique 
25 d. amplification telle que la PCR (Polymerase Chain 
Reaction), dans un precede d • elongation, tel que le 
sequengage, dans une methode de transcription inverse ou 

analogue , ^ . ^ . 

- deux sequences nuclfeotidiques ou peptidiques 

30 sont dites equivalentes ou d^rivees I'une par rapport a 
1. autre, ou par rapport a une sequence de reference, si 
fonctionnellement les biopolymeres correspondants peuvent 
jouer sensiblement le mSme role, sans ^tre identiques, 
vis-a-vis de 1 • application ou utilisation consideree, ou 

35 dans la technique dans laquelle elles interviennent ; sont 
notamment equivalentes deux sequences obtenues du fait de 



wo 99/02696 



PCT/FR98/01442 



la variabilite naturelle au sein d'un meme individu, ou de 
la diversite naturelle d'un individu a un autre au sein 
d'une meme espece, notamment mutation spontanee de 
I'espece a partir de laquelle elles ont ete identifiees, 
5 ou induite, ainsi que deux sequences homologues, 
I'homologie etant definie ci-apres, 

- par "variabilite", on entend toute modification, 
spontanee ou induite d'une sequence, notamment par 
substitution, et/ou insertion, et/ou deletion de 

10 nucleotides et/ou de fragments nucleotidiques , et/ou 
extension et/ou raccourcissement de la sequence a I'une au 
moins des extremites; une variabilite non naturelle peut 
resulter des techniques de genie genetique utilisees, par 
exemple du choix des amorces de synthese, degenerees ou 

15 non, retenues pour amplifier un acide nucleique; cette 
variabilite peut se traduire par des modifications de 
toute sequence de depart, consideree comme reference, et 
pouvant etre exprimees par un degre d'homologie par 
rapport a ladite sequence de reference, 

2 0 - I'homologie caracterise le degre d'identite de 

deux fragments nucleotidiques ou peptidiques compares ; 
elle se mesure par le pourcentage d'identite qui est 
notamment determine par comparaison directe de sequences 
nucleoditiques ou peptidiques, par rapport a des sequences 

25 nucleotidiques ou peptidiques de reference, 

- ce pourcentage d'identite a ete specif iquement 
determine pour les fragments nucleotidiques, notamment 
clones relevant de la presente invention, et provenant 
d'un meme individu; a titre d' exemple non limitatif, le 

30 plus faible pourcentage d'identite observe entre les 
differents clones d'un meme individu (cf SEQ ID NOs; 13 et 
14) est d'au moins 90% et le plus faible pourcentage 
d'identite observe entre les differents clones de deux 
individus est d'au moins 80%, 

35 - tout fragment nucleotidique est dit equivalent 

ou derive d'un fragment de reference, s'il presente une 
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s^quanc. nuoUotidiqu. Equivalents * la s*c,ue„cs du 
tr^^ent de r^f^rence ; selon la definition precedente 
sent notamment equivalents i un fragment nu=leotxdxque de 

reference ; 

(a) tout fragment susceptible de s'hybrxder au 
moins partiellement avec le complement du fragment de 

reference, , ^ 

(b) tout fragment dont I'alignement avec le 

fragment de reference conduit a mettre en ividence des 
XO bases contigaes identigues, en nombre plus important 
gu'avec tout autre fragment provenant d-un autre groupe 

taxonomique , ^ -^^^^ 

(c) tout fragn^ent resultant ou pouvant resulter de 

la variabilite naturelle au sein d^un mexne individu et de 
15 la diversite naturelle d'un^ individu a un autre dans la 
xa^me espece, a partir desquels il est obtenu, 

(d) tout fragment pouvant resulter des techniques 
de genie genetique appliquees au fragment de reference 

(e) tout fragment, comportant au moins huit 
20 nucleotides contigus, codant pour un peptide homologue ou 

identique au peptide code par le fragment de reference, 

(f) tout fragment different du fragment de 
reference, par insertion, d.l.tion, substitution d'au 
xnoins un monomere, extension, ou raccourcxssement a 1 une 

• o ses extremites ; par exemple, tout fragment 

25 au moxns de ses exT^remxcc , t- - ^ , ,„„^ 

correspondant au fragment de reference, flanque a 1 une au 
moins de ses extremites par une sequence nucieotidique ne 
oodant pas pour un polypeptide, 

- par sequence nuoieotidique, partielle ou totale, 
30 d.un materiel nucieique de reference, on entend egalement 

toute sequence associee par co-encapsidation, ou par 
coexpression, ou recombinee avec ledit materiel nucleigue 

de reference, 

- par polypeptide, on entend notamment tout 

35 peptide a-au moins deux acides amines notamment 
Oligopeptide, proteine, extrait, separe, ou 
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substantiellement isole ou synthetise, par 1 ' intervention 
de la main de I'hoiume, notamment ceux obtenus par synthese 
chimique, ou par expression dans un organisine recombinant, 

" par polypeptide code de maniere partielle par un 
5 fragment nucleotidique, on entend un polypeptide 
presentant au moins trois acides amines codes par au moins 
neuf monomeres contigus compris dans ledit fragment 
nucleotidique , 

- un acide amine est dit analogue a un autre acide 
10 amine, lorsque leur caracteristiques physico-chimiques 
respectives, telles que polarite, hydrophobicite , et/ou 
basicite, et/ou acidite, et/ou neutralite, sont 
sensiblement les memes ; ainsi, une leucine est analogue a 
une isoleucine, 

15 - tout polypeptide est dit equivalent ou derive 

d'un polypeptide de reference, si les polypeptides 
compares ont sensiblement les memes proprietes, et 
notamment les memes proprietes antigeniques , 

immunologiques, enzymologiques et/ou de reconnaissance 

20 moleculaire ; est notamment equivalent a un polypeptide de 
reference : 

(a) tout polypeptide possedant une sequence dont 
au moins un acide amine a ete substitue par un acide amine 
analogue, 

25 (b) tout polypeptide ayant une sequence peptidique 

equivalente, obtenue par variation naturelle ou induite 
dudit polypeptide de reference, et/ou du fragment 
nucleotidique codant pour ledit polypeptide, 

(c) un mimotope dudit polypeptide de reference, 

30 (d) tout polypeptide dans la sequence duquel un ou 

plusieurs acides amines de la serie L sont remplaces par 
un acide amine de la serie D, et vice versa, 

(e) tout polypeptide dans la sequence duquel on a 
introduit une modification des chaines laterales des 

35 acides amines, telle que par exemple une acetylation des 
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fonctions amines, une carboxylation des fonctxons thiol, 
une estferification des fonctions carboxyliques, 

(f) tout polypeptide dans la sequence duquel une 

ou des liaisons peptidiques ont ^t^ modifiees, coroxne par _ 
5 exetnple les liaisons carba, retro, inverso, retro-xnverso, 
r^duites, et methylene-oxy , _ 

(g) tout polypeptide dont au luoins un antigene est 
reconnu par un anticorps dirige centre un polypeptide de 

reference, . 
^0 _ le pourcentage d'identite caracterisant 

l.homologie de deux fragments peptidiques compares est 
selon la presente invention d'au moins 80% et de 
preference au moins 90%. 

15 Les expressions d'otdre utilisees dans la presente 

description et les revendications , telles que "premiere 
sequence nucl^otldique" ne sent pas retenues pour exprxmer 
un ordre particulier, mais pour dSfinir plus clairement 

1' invent ion • . . 

,„ par detection d'une substance ou agent, on entend 

ci-apr6s aussi bien une identification, qu'une 
quantification, ou une separation ou isolement de ladxte 

substance ou dud it agent- 

,5 L. invention sera mieux comprise a la lecture de la 

description d.taillee qui va suivre falte en r*£»rence aux 
Figures annex^es dans lesquelles : 

_ la Figure 1 represente, d'une part, 
1. organisation du materiel retroviral 
30 selon la presente invention, sous la forme d'un AKNm 
30 selon P d'autre part, la localisation des 

g^nomique putatxf, et, cl autre p , r.ar 
clones mise en oeuvre selon la presente xnventxon, par 
rapport . cette organisation; les .chelles de longueur 
sent exprimees en Kb ; les regions flanquantes (5- UTR et 
35 3. UTR) sont indiqu^es dans des boltes hachurees ; les 
regions r.pet.es dans ces deux regions flanquantes sont 
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indiguees par des fleches noires ; les regions 
correspondant aux genes gag, pol, et env, sont indiques 
respect iveiuent, en noir, blanc et gris ; le positionnement 
de la sonde Ppol-MSRV est indique ; 
5 - la Figure 2 represente une possibility 

d • organisation genetique (ADN) , illustree par le clone 
RG083M05, et une strategic d'epissage liant a cette 
sequence, les clones experimentaux (ARNm) ; cette figure 
montre egalement les sites d'epissage observes par 
10 reference a 1 ' organisation retrovirale ; sur cette figure 
sont en outre indiques : 

la localisation des sondes utilisees (Pgag-LBIS, 
Ppro-E, Ppol-MSRV et Penv-C15) ; 

les sites donneurs (DSl et DS2) et accepteurs (ASl 
15 a AS3) d*epissage ; 

les sequences provenant du clone RG083M05, dans 
les boltes en minuscules, et les sequences derivant des 
clones experimentaux placentaires (ARNm) , dans les boltes 
en majuscule ; 

2 0 les ORFs putatives (ORFl, ORF2 et ORF3) ; et 

un insert de 2 Kb present sous forme ADN mais non 
detecte sous forme ARN, represente sous forme de hachures 
verticales. 

Les autres conventions utilisees dans cette figure 
25 sont les memes que celles de la Figure 1, 

- la Figure 3 donne une representation de clones 
genomiques (ADN) correspondant aux clones d'ADNc isoles ; 
sur cette figure, sont indiques : 

le pourcentage de similitude vis-a-vis de I'ARN 

3 0 genomique reconstruit (ARN Recons) ; 

la presence de sequences repetees a chaque 
extremite de ces genomes (repetitions) ; et 

la presence et la taille des trames de lecture 
ouverte (ORFs) • 

3 5 - la Figure 4 represente une analyse phylogenique 

identifiant la famille HERV-W. 
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- la figure 5 represents I'alignement des regions 
flanquantes 5 • et 3 • du clone RG083M05 avec les regions 5- 
et/ou 3- terminales de certains clones placentaires ; le 
tandem CAAC flanquant les LTR 3 • et 5 • est souligne 
5 doublement sous les sequences d'ADN, la sequence LTR 
consensus de 783 pb (paires de bases) est indiqu6 au bas 
de I'alignement ; le PPT en amont de I'extremite 5' de LTR 
et le PBS en aval de I'extremite 3' de LTR sent indiques ; 
les regions U3R et U5 sont indiquees ; les sites 
10 correspondant a la fixation du facteur de transcription 
sont soulignes et numerotes de 1 a 6 ; la region -73 a 284 
correspond a la sequence evaluee en "CAT assay" ; * 
correspond a des sites putatifs de "capping" ; [polyA] 
indique le signal de polyadSnylation. 

_ la Figure 6 represente une sequence, putative 
d'un polypeptide d'enveloppe (ORFl) de HERV-W obtenu a 
partir de 3 clones d'ADNc placentaires differents ; le 
peptide leader (L) , la proteine de surface (SU) et la 
proteine transmembranaire (TM) sont indiquees par des 
fleches ; le peptide de fusion hydrophobe et la region 
carboxy transmembranaire sont soulignes par un trait 
simple et un trait double, respect ivement ; la region 
d- immunosuppression est signalee en italiques ; les sites 
potentials de glycosylation sont indiques par des points ; 
les acides amines divergents sont indiques sur la ligne 
inferieure ; la figure 6 presente egalement les trames de 
lecture ouverte correspondant a ORF2 et ORF3 tels que 
decrits a la Figure 2, et plus particulierement leurs 
homologies avec les genes de regulation retroviraux. 



20 



25 



30 



Le materiel nucleique precedemment explicite a ete 
decouvert et caracteris^ au terme du protocole 
experimental d^crit ci-apres, etant entendu que ce 
protocole ne saurait limiter la portee de la presente 
35 invention et des revendications en annexe. 
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Exempl X 

Isolement: et sequengage de fragments d*ADNc 
chevauchants 



5 Les informations concernant 1 • organisation de 

HERV-W ont ete obtenues en testant une banque d*ADNc 
placentaire (Clontech cat#HL50l4a) avec les sondes 
Ppol-MSRV (SEQ ID NO: 29) et Penv-C15 (SEQ ID NO: 31) (cf 
Exemple 8) , et en pratiquant ensuite une technique de 

10 "gene walking" a I'aide des nouvelles sequences obtenues, 
Les experiences ont ete mises en oeuvre en se referant aux 
preconisations du fournisseur de la banque. Des 
amplifications PGR sur ADN ont egalement ete exploitees 
pour comprendre cette organisation. 

15 Un certain nombre de clones ont ete selectionnes 

et sequences, cf Figure 1: 

- Clone C1.6A2 (SEQ ID NO: 1) : region 5* non 
traduite de HERV-W et une partie de gag 

- Clone C1.6A1 (SEQ ID NO: 2): gag et une partie 

20 de pol 

- Clone C1.7A16 (SEQ ID NO: 3): Region 3' de pol 

- Clone cl.Pi22 (SEQ ID NO: 4): region 3' de pol 
et debut de env 

- Clone cl,24.4 (SEQ ID NO: 5) : ARN episse 
25 comprenant une partie de la region 5 ' non traduite de 

HERV-W, la fin de pol et la region 5' de env 

- Clone C1.C4C5. (SEQ ID NO: 6) : fin de env et 
region 3 * non traduite de HERV-W 

- Clone C1.PH74 (SEQ ID NO: 7) : ARN sous- 
3 0 genomique : region 5' non traduite de HERV-W, fin de pol, 

env, et region 3 • non traduite de HERV-W 

- Clone C1.PH7 (SEQ ID NO: 8) : ARN multi-episse : 
region 5' non traduite de HERV-W, fin de env et region 3' 
non traduite de HERV-W. 

35 - Clone cl.Pi5T (SEQ ID NO: 9) : gene pol partiel 

et region U3-R 
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- Clone cl.44.4 (SEQ ID NO: 10) : region R-U5, 

gene gag et gene pol partiel. 

A I'aide de ces clones, en procedant a des 
aligne^ents de sequences, un xnodele de sequence totale de 
5 HERV-W a ete elabore. Les ARN episses ont ete mxs en 
evidence ainsi que les sites potentiels donneurs et 
accepteurs d'epissage. L'ensexuble de ces inf orxnatxons est 
^ontr. . la Figure 2. Par .tude de ^^-^^^^^f^ ^^^^ 
retrovirus existants, les entites LTR, gag, pol et env ont 

.0 .t. <^^^^"^-;^^^^^^^,^^ ,.,..ive de HERV-W sous 

forme ARN est la suivante (SEQ ID NO: 11): 
gene 1..7582 

I^ocalisation des clones sur la sequence ARN genomxque 

15 reconstruite 

C1.6A2 (1321 pb) 1-1325 ; 

C1.PH74 (535+2229= 2764 pb) 72-606 et 5353- 
7582; 

Cl.24.4 (491+1457= 1948 pb) ; 115-606 et 5353- 

20 6810; 

cl.44.4 (2372 pb) 115-2496 ; 

C1.PH7 (369+297= 666pb) 237-606 et 7017-7313; 
C1.6A1 (2938 pb) 586-3559.; 

cl.PiST (2785+566= 3351 pb) 2747-5557 et 7017- 

25 7582; 

C1.7A16 (1422 pb) 2908-4337; 

cl.Pi22 (317+1689 = 2006 pb) 3957-4273 et 

4476-6168; 

C1.C4C5 (1116 pb) 6467-7582 

30 5«LTR 1..120 

/note="R of 5 'LTR (extremite 5 

incertaine" 

121. .575 

/note="U5 of 5 'LTR" 

35 divers 579.-596 

/note="PBS primer binding site pour tRNA-W" 
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divers 



divers 



10 divers 



ORF 



15 divers 



ORF 



ORF 

20 

divers 



3 'LTR 



25 divers 



606 

/note=" jonction d'epissage (site donneur 
d'epissage ATCCAAAGTG-GTGAGTAATA et site 
accepteur d'epissage CTTTTTTCAG-ATGGGAAACG 
clone RG08 3M05, GenBank accession 
AC000064) " 
5353 

/note="site accepteur d'epissage pour 

I'ORFl (env)" 

5560 

/note="site donneur d'epissage" 
5581. .7194 

/note="ORFl env 538 AA" 

/produit-="enveloppe" 

7017 

/note="site accepteur d'epissage pour ORF2 et ORF3" 

7039. .7194 

/note="ORF2 52 AA" 

7112. .7255 

/note="ORF3 4 8 AA" 

7244. .7254 

/note="PPT polypurine tract" 
7256. .7582 

/note-="U3-R of 3' LTR (jonction U3-R indeterminee ) 
7563 . .7569 

signal de polyadenylation 



3 0 Exemple 2 : 

Identification de clones genomigues (ADN) 
correspondant aux clones d*ADN isoles 

Une interrogation "blastn" sur plusieurs bases de 
35 donnees, a I'aide du genome reconstruit, montre qu'il 
existe une quant ite import ante de sequences apparentees 
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vnviron 400 sequences ont ete 
dans le genome humam. Environ m ^ 

tlentlfi^es aans GenB.n. plus de 200 s.,^e„ce. dans la 
^n,ue EST, la plupar. en -ti-sens I.S 4 se<^ences - 
plus signiflcatives en taille et en s«ll.tude ^"o™ 
5 sur la figure 3, sont les clones ,en=m.ques (ADN) 

suivants =^ ^^^^^ ^^^^^^^^ 1, 

^°-"=^rcror:urrBs;";;:t^;i.e, .Koooeeo 

= rielta du recepteur des 

LO correspondant au locus alpha delta 

r.^■^■^^^^f>s T localise en 14qll-12, 

cellules 1, xo'^ ^ oilMlS (qb AF045450) 

le cosmide humam Q11M15 ^go 

correspondant a la region 2lq22.3 du chromosome 21 

le cosmide U134E6 (embl Z83850) sur le chromosome 

''''''' La localisation des regions align^es pour chacun 
aes Clones est indigu.e et 1 • appartenance a un chr™ 
est indiqu.e entre crochets. Le pourcentage "-^^^^^ 

- T:XJ^^ rchaque\.tr.mit. du g.n^e e. . 
faille des plus grandes traces de lecture (OEF) . Des 
: ncel r.:...es son. .rouv.es au. e.«..i.es de 3 de 
Ta sequence reconstruite est contenue 
a l-inttrieur du clone KG033H05 0.6 Kb, et 
" i:rrt u'e sUlitude de cepenaant le clone 

ZZT. pr.sente une " ^ , ^^l.^f^r 

4. =T, aval de la region 5' non traaun:e \=> 
ZT rser\-n est .,ale.ent trouv.e dans deu. 

30 ^es Clones es ,u. u^e 

0 -x Kb immediatement en amont de la region ^ 
2,3 KJ3 immeui los trois trames de 

UTR^ Aucun clone ne contient les trois 
(3 UTR). Au fonctionnelles. Le clone 

lecture (ORFs gag, pol et env ion 

xecture \ r>pv de 538 acides amines (AA) 

.30S3«0= jn„r:je J.ure. .e cosmide QllMl. 

^= Tn-rrx ;r:::es 0..s%o„tl,Ues de .13 ^ <tra.e 0> 
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et 305 AA (trame +1) correspondant a une polyproteine pol 
tronquee . 

Exemple 3 
5 Analyse phylogenique 

Une analyse phylogenique a ete realisee au niveau 
des acides nucleiques sur 11 sous-regions differentes de 
I'ARN genomique reconstruit, et au niveau proteique sur 2 

10 sous-regions differentes de env» Tous les arbres obtenus 
presentent la meme topologie quelle que soit la region 
etudiee. Ceci est illustre a la Figure 4 au niveau des 
acides nucleiques dans les regions LTR et pol les plus 
conservees entre les sequences obtenues et ERV-9 et RTLV- 

15 H. Les arbres montrent clairement que les sequences 
experimentales decrivent une nouvelle famille distincte de 
ERV-9 et tres distincte de RTLV-H comme souligne par 
1" analyse en "bootstrap". Ces sequences sont trouvees sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 

20 16, 21, 22, et X avec une forte concentration apparente de 
LTR sur le chromosome X. 

La comparaison au niveau proteique entre les 
regions les plus conservees des proteines retrovirales env 
montre que la famille HERV-W est plus proche des 

25 retrovirus simiens de type D et des retrovirus de la 
reticuloendotheliose aviaire que les retrovirus mammiferes 
de type C. 

Ceci suggere une structure genomique chimere C/D. 

30 

Exemple 4 

Identification des elements LTR, PPT et PBS 

La sequence reconstruite (ARN) est contenue 
35 integralement a 1 ' interieur du clone genomique RG083M05 
(9,6 Kb) et presente une similitude de 96 % avec deux 
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regions discontinues de ce clone qui contient egalement 
des regions r^p^tees a chaque extrfemit^. L'alignement des 
sequences experiment ales correspondant aux regions 5- et 
3. de I'ARN genomique reconstruit avec I'ADN du clone 
5 RG083M05 [ 5 ' ( 5-RG-28000-28872 ) et 3 ' (3-RG-37500-38314> ] a 
permis de deduire une sequence LTR et d' identifier des 
elements caracteristiques des retrovirus, notamment ceux 
impliques dans la transcription inverse, a savoir PBS en 
aval du LTR 5' et le PPT en amont du LTR 3' (cf Figure 5). 
LO on remarque que 1- element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des maxnmiferes, et est comparable en taille a la region U3 
gen^ralement decrite chez les retrovirus de type D et les 
retrovirus aviaire. La region correspondant aux bases 2364 
15 a 2720 du^ clone C1.PH74 (SEQIDNO: 7) a ete^amplifiee par 
PGR et sous-clon^e dans le vecteur pCAT3 (Promega) afin de 
r^aliser 1' evaluation de I'activite promotrice. Une 
activite significative a ete trouvee dans des cellules 
HeLa par la methode dite du "CAT assay" montrant la 
20 fonctionnalite de la sequence promotrice du LTR. 

La region PBS est homologue au PBS des retrovirus 



aviaires. 



25 Exemple 5 

organisation gfenetique et regulation de 



1» expression 



Organisation sous forme ADN 

30 Des amplifications PGR ont ete realis^es sur des 

clones HERV-W entiers recuperes sur banque genomxque 
humaine (voir exemple 1 pour le mode d- obtention) , en 
utilisant les couples d • oligonucleotides suivants : 
U5 4992 (SEQ ID NO: 16), GAG 4619 (SEQ ID NO: 17) 

35 GAG 4782 (SEQ ID NO: 18), POL 3167 (SEQ ID NO: 19) 
POL 3390 (SEQ ID NO: 20), POL 5144 (SEQ ID NO: 21) 



wo 99/02696 



PCT/FR98/01442 



POL 5145 (SEQ ID NO: 22) , U5 4991 (SEQ ID NO: 23) . 

Les PGR sont realisees dans les conditions 
suivantes : 

Oligonucleotides a la concentration de 0,3 3 
5 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymerase Boerhinger 
Melange de dNTP a 0,2 5 mM chacun 
0,5 mg d'ADN humain 
10 Volume final 100 ml 

Conditions de PGR (95°C, 5 min) x 1, (95*=*C, 30 sec 
+ 54^C, 30 sec + 72°C 3 min) x 35. 

Les produits de PGR ont ensuite ete deposes sur 
gel d' agarose 1% pour etre analyses apres migration. 
15 L' ensemble des PGR donne des fragments d ' amplification de 
taille attendue, excepte pour la PGR LTR-4991 — gag-4619 
qui donne un fragment de taille superieure d' environ 2 Kb 
par rapport a la taille attendue (deduite a partir des 
cDNA de la banque placentaire) . La reconstitution de 
20 HERV-W sous forme ADN endogene represente done une entite 
d' environ 10 Kb. 

Apres clonage, sequen?age et analyse de la PGR- 
4992 gag-4619, on constate la presence d'une region 
d' insertion entre LTR et gag de SEQ ID NO: 12 (clone 
25 C1.6A5). Cette region ne correspond pas a une region 
traditionnelle non traduite d'un retrovirus : pas de 
region T ni de PBS. 

Les produits de PGR pol-3390, pol-5144 ont ete 
egalement clones et deux des clones obtenus ont ete 
30 sequences. Le resultat de ces sequences est donne par les 
clones C1.7A20 (SEQ ID NO: 13) et cl.7A21 (SEQ ID NO: 14). 
La comparaison de ces deux sequences nucleotidiques donne 
un score de 90% d*homologie pour la region concernee, 
montrant ainsi la variabilite de HERV-W chez un meme 
35 individu. 

HERV-W sous forme ADN est propose la Figure 2 . 
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org.nis.tion g^nerale -. processus de transcription 

Les diffSrents clones ADNc Stant obtenus, des 

rtr»T? csiii- ADN. on deduit : 
resultats acquis en PCR sur auim, ^ ^ 

-une organisation ADN de 10 Kb possedant une 
st^ence d- insertion de . Kb -tre LTR et ^ag 

Le rSsultat de PCR sur ADN montrant la p 
^.un insert de 2 Kb entre les regions I.TK et gag suggere 
!u e les ADHC isol.s dans le placenta proviennent de 
10 1. expression d-un g^noBe de type RG083M05. ^ 

-une organisation ARB de 8Kb resultant dune 
transcription de 10 Kb sulvle d-un .pissage entre .TR et 
gag per^ettant de restaurer une '^^^^^^ 
Flanguante, 5' gag. et donnant ainsi un Am. de 8 

- - gr"- .0= 30, . 

V ™ ID NO: 32) revelent un ARN de taxlle 
protease (Ppro-E, SEQ ID Nu. r4vele 
• • 5 R Kb la sonde Penv-C15 (SEQ ID NO; 31) revele 
voisxne a 8 Kb, 1^ ^°" ^^^^^ definies dans 

. rar^U^^nJn-rdulU'obtnues par le crlbl^e d^ .a 

— Ti tre%"^r::l.':;7rir d:Ti::e 

du clone C1.6A2 et sona arN et un ARN 

oi 4^ revelent les deux precedents ARN 

13 Kb Cette distribution des ARNs est typxque 

::"cri;s de* retrovirus complexes : un ARN ..no.i.ue 

::dar:i .a.-pro-po. un ARN ^--^x^;:;-:^ 

,in/des ARN multi-episse ^s; 
I'enveloppe, et un/des 

potentlelle^ent pour des g.nes - 
La demie vie d'un tei akw 
30 P0L-E«V-U3-R-HERV-«, est -alseMblable.ent tres courte 
car aucun ARN de 10 Kb n'est d4tect^ en Northern Blot. Par 
Inalvse et co,.paralson de sequences, les sites potentiels 
analyse i-^^x t' AS3^ d'epissage 

donneurs (DSl et DS2) et accepteurs (ASl a AS3) P 
ont M difinis et decrits dans la Figure 2. 
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Exemple 6 

Transcription dans des tissus sains 

Differents tissus humains sains ont ete testes par 
5 une technique de Northern Blot (Human Multiple Tissue 
Northern Blot, Clontech cat# 7760-1), a I'aide des sondes 
Ppol-MSRV (SEQ ID NO: 29), Pgag-LB19 (SEQ ID NO: 30), 
Penv-C15 (SEQ ID NO: 31), Ppro-E (SEQ ID NO: 32), P5 ' -gag- 
cl.6A2 et P5 ' -env-cl • 24 . 4 , marquees comma decrit dans 

10 1' exemple 1. Les experiences ont ete realisees en suivant 
les recommandations des fabricants, et les 

autoradiographies ont ete exposees 5 jours. L' analyse des 
resultats revele des produits de transcription uniquement 
dans le placenta, et dans aucun des autres tissus humains 

15 testes (coeur, cerveau, poumon, foie, muscle squelettique , 
rein et pancreas) . 

Par une technique de Dot Blot ARN (Clontech : 
Human RNA Master Blot Cat# 7770-1) , et en utilisant le 
protocole experimental preconise par le fabricant, une 

20 quarantaine d ' autres tissus, dont des tissus foetaux, ont 
ete testes : seul le placenta donne une reponse specif ique 
apres hybridation avec les sondes Pgag-LB19 
(SEQ ID NO: 30) et Penv-C15 (SEQ ID NO: 31) . 

On constate qu'un signal est observe dans le rein 

25 en Dot-Blot ARN, ce qui est infirme par 1' analyse en 
Northern Blot. 

Exemple 7 

3 0 Identification d*un ARNm codant pour une enveloppe 

et les moyens de le detecter specif iquement 

Le criblage d'une banque d'ADNc placentaire a 
l*aide d'une sonde definie dans la region 5' non traduite 
35 a permis d'isoler un ADNc defini par une region 5' non 
traduite (5' NTR) , une jonction d'epissage, une sequence 
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codante, una region 3' non traduite (3- NTR) et una queue 
polyadenylee, cl.PH74 (SEQ ID NO: 7). Ce clone correspond 
a un ARN 6piss4 codant pour une enveloppe. Par comparaison 
de sequences entre ce cDNA et le modele de HERV-W endogene 
5 propose selon Figure 2, on identifie une 3°-^-n 
d.^pissage sur I'ARNm, jonction d'epissage mettant en 
continuite la region 5' NTR et le g^ne env, conduisant a 
1. elaboration d'un ARN sous genomique episse codant pour 
le gene d' enveloppe. Ces informations ont permis de 
10 definir un oligonucleotide specifique de cet ARNxn, en 
choisissant une localisation situee sur le site d'epissage 
(Oligo 5307, selon SEQ ID NO: 24). 

La mise en evidence de cette region de jonctxon 
periaet d'etablir un precede de discrimination entre ARN et 
15 ADN retroviral endogene, en utilisant dans une , PGR un 
oligonucleotide defini sur cette region de jonctxon, 
notamment un oligonucleotide choisi dans le gene env 
(Oligo 4986, selon SEQ ID NO: 25). 

Les PGR sont realisees dans les conditions 

20 suivantes : ^ . 

Oligonucleotides a la concentration de 

0,33 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymerase Boerhinger 
25 Melange de dNTP a 0,25 mM chacun 

0,5 mg d'ADN humain 
Volume final 100 ml 
sur 10 ADN differents testes, ce type de PGR n'a 
pas permis d'obtenir de produits d' amplification Par 
30 centre sur ADNc issu d-ARN placentaire ou de cellules 
exprimant HERV-W, cette PGR donne un produxt 
d'amplification. Ge resultat confirme done la nature 
specif iquement ARN de ce fragment sous-genomique. 



35 
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Exemple 8 

Identification de sequences codantes, contenues 
dans un ARNm specif ique 



5 La strategie d'epissage decrite dans !• exemple 5 

est compatible avec la presence de trois trames de lecture 
ORFl (SEQ ID NO: 33) , ORF2 (SEQ ID NO: 34) et ORF3 
(SEQ ID NO: 35) (cf Figure 6). 

Le criblage d'une banque d'ADNc placentaire a 

10 permis d'isoler un ADNc (SEQ ID NO: 7, cl.PH74) defini par 
une region 5' non traduite (5' NTR) , une jonction 
d'epissage, une sequence codante, une region 3' non 
traduite (3' NTR) et une queue polyadenylee ♦ La sequence 
codante est de 53 8 acides amines (SEQ ID NO: 33) . Les 

15 analyses effectuees sur banques de donnees permettent de 
mettre en evidence des caracteristiques d'une enveloppe 
retrovirale complete, : debut de traduction d'une 
polyproteine d' enveloppe, d'un peptide leader fortement 
hydrophobe d' environ 21 acides amines, d'une proteine de 

20 surface SU, d'une proteine transmembranaire TM. Ces deux 
entites proteiques presentent differents sites potent iels 
de glycosylation. Au sein de la proteine TM, on identifie 
une region immunosuppressive* 

22 pb et 9 5 pb en amont du site accepteur 

25 d'epissage, on a trouve respectivement deux codons 
d' initiation susceptibles de diriger la synthese de 52 AA 
(ORF2, SEQ ID NO: 34) et de 48 AA (0RF3, SEQ ID NO: 35). 
ORF2 consiste en une partie de I'extremite carboxy- 
terminale de env et ORF3 correspond a une traduction 

3 0 differente mais chevauchante, 

Aucune homologie significative n'a ete retrouvee 
par interrogation "blast". Cependant une interrogation 
LFASTA dans une sous-banque de donnee limitee aux 
Retrovir idae, ORF2 et ORF3 ont montre un pourcentage 

35 d'idendite de 35 % avec, respectivement. Rex du virus T- 
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4- ^^in,a+-e et avec Tat du virus siinien 
lymphotrope humam et primate, et avet, 

de 1 ' immunodef icience . 



5 Exemple 9 

Complexite de la famille HERV-W 

Le nombre de copies pr^sentes dans le genome 
humain de chacune des sequences est evalue par une 
10 technique de Dot Blot, a I'aide des sondes Pgag-LB19 
(SEQ ID no: 30), Ppro-E (SEQ ID NO: 32) et Penv-C15 

(SEQ ID NO: 31) . 

Chacune des sondes est denatures et deposee sur 

une membrane Hybond Nt- a raison de 2,5, 5, 10, 25 50 
15 lOOpg par d^pet. 0,5 mg d'ADN humain sont egalement 
d^pos^s sur la meme membrane. Les membranes sont sechees 
2 heures sous vide a 80oc. Les membranes sont ensuxte 
hybrid^es avec la sonde deposee. Les techniques de 
.arquage des sondes, d-hybridation et de l-^^-J- 
20 membranes sont les m^mes que pour le Southern Blot. Apres 
autoradiographie des membranes, on constate des nxveaux 
d'intensite de signal proportionnels aux depots sur 
.embrane. Apr.s decoupage des zones d'hybridation, un 
comptage en scintillation est r.alis.. Par --P--^- 
25 entre la gamme de dilution de la sonde <^.-P-- 

membrane et le r.sultat obtenu avec I'ADN humaxn on peut 
evaluer le nombre de copie par genome haploxde de chacune 
des regions couvertes par les sondes : 

- le nombre de gag endogene est evalue de 56 a 112 

30 copies (76) ^ ^ ^ ^ ^ 

- le nombre de protease endogene est evalue de 166 

a 334 copies (260) , . ^, . ~ 

- le nombre de env endogene est lvalue infer leur a 

52 copies (13). ^lAnw 
35 Le crlblage de 106 clones d-une banque d ADN 

pxacentaire hunain (clontech cat* H15014b, a permis de 
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denombrer 144 clones reconnus par la sonde Pgag-LB19, et 
64 clones reconnus par la sonde Penv-C15. 13 clones 

hybrides con jointeinent par les sondes Penv-C15 et 

Pgag-LB19 ont ete isoles, confirmant la presence de 

5 plusieurs copies d'un genome possedant a la fois gag et 
env, sans consideration de f onctionnalite . 



Le materiel nucleique, les sequences 

10 nucleotidiques , et les peptides ou proteines 
eventuellement expritnees par lesdits materiels et 
sequences, peuvent etre utilises pour detecter, prevoir, 
traiter et suivre toute maladie auto-immune, et les 
pathologies qui lui sont associees, ainsi que des cas de 
15 grossesse pathologique ou d'insucces de grossesse. 

En effet, les donnees objectives et experimentales 
permettent de relier retrovirus et maladies auto-immunes 
et retrovirus et perturbations de la grossesse : 

(1) des mecanismes communs sont mis en oeuvre dans 
20 les pathologies retrovirales et dans des maladies auto- 
immunes (presence d'auto-anticorps, de complexes immuns, 
infiltration cellulaire de certains tissus, troubles 
neurologiques) . 

(2) des desordres pathologiques comparables a 
25 certaines maladies auto-immunes apparaissent lors des 

infections par les retrovirus HIV et HTLV (syndrome de 
Sjogren, lupus erythemateux dissemine, arthrite 
rhumatoide. • . ) • 

(3) une activite transcriptase inverse a ete 
3 0 detectee et des particules de type retroviral ont ete 

observees dans les surnageants de cultures cellulaires de 
patients atteints de sclerose en plaques (Perron et coll, 
Res. Virol. 1989; 140: 551-561 / Lancet 1991; 337: 862-863 
/ Res. Virol, 1992; 143: 337-350) ou de polyarthrite 
3 5 rhumatoide . 
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an i males inf lammatoires 
(A) des pathologies anxmaies 

liees aux retrovirus 
^v,r-oniaues ou auto-inwnunes sont liees 

chronxques ° ^'entre elles sont utilisees comme 

andogenes; certaines d antra insulino- 
modelas animaux de maladies humaines (dia 

...... Js .nao,.„e. J^^^ 

maladies auto-immunas , systemiquas o . , 

maiaaies a. communiquees par 

d'autres donnees dans ce sens ont ete 

.uteurs au IVame meeting europeen sur les 
" : =s nZLs .PPS.la. oc.o..e .... O-a... 

..„oviru. e„ao,.nes, "^^^-^-^.^f t^,;, Lallve.ent .lev. 
15 pendant ia grossesse mais-auss. •ians le cad 

• ^^1^ aue le syndrome de Soogren, 

dSsordres .uto-irmuns tel. que 1 Y p^iya^thrite 
lupus arythSmateux dissemine ou P Y 

.Lto.de. sans toutefois qu.une 

..pUcat.on ---/--;/:rorurd nt rp..no„.ne 
30 l..i:.pXxcation des retrovi ^aractere 

d'auto-immunit. reste compatible avec ^ 
lltlfactoriel des maladies auto-immunes, systemiques 
rnila^Itoires con.rontent des .acteurs ,.neti,ues. 

" cultu.es celllla.es .a -e^^,. t^^^: 

rsrou"r'polYa.t...te .numato.de ,do™,*es non . .^^^^^ 

r»<a 1 ' expression: (i) un i-^^ 
30 peuvent "-"^"^/^J ^a replication, (il) de plusieurs 
endo,.ne -""f ^"^^ J^.,^:^,,^ coop.rant par un pWnom.ne 
retrovirus endcgenes ^^^^^^^ J retrovirus excg.ne. 
de transcompltmentation ou (ill) i un r 

Toutes ces observations permettent d >■"^'• 
35 considerer les .ateriels bioloqiques prec*dem.ent decrlts. 
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comme marqueur d'une maladie auto-immune ou de 
perturbations de la grossesse* 

En particulier, les techniques de marquage 
suivantes sont considerees : 
5 - balayage du genome humain avec des sondes 

d 'hybridation a forte stringence, derivees du materiel 
nucleique precedemment decrit, 

- amplification directe d'ADN genomique par PGR, 
en utilisant des amorces specif iques pour la region 

10 consideree 

- analyse des regions flanquantes de genes 
cellulaires etrangers. 
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10 



15 



REVENDICATIONS 
l/«at»rlel nucUique de type genoBlque 

genome comprend une sequ sequences 

. • /»=»r.<= le qroupe incluam: j-^^ m 

choxsia dans le ^ / ^^^^^ ,o„pl4.entaires, et 

"--"--njr:r:o-.s Ce ";r..::\e..e„en. au 
Iir^ro";.::. a.e= .e.ec..ve„en. .esd.e. 

siquences SEQ ID NOs: la 15 ge„ol.ique 
2/ Materiel nuclexque J^^^ J 

• T s I'etat isole ou purine, 
retroviral, a 1 et fonctionnel, dont le 

partiellement fonctxonnel ou ^ ^ r.f.rence, 

genome comprend une sequence ""^^^^f ""'^ ^^^^^ 3^ite 

"::j:rrre/::r„ra; :rns\o., e. de 

contique a.hcoloqie avec une sequence 

preference au moins ^^.^^ 

Ta^re^Toncrnrr de la sequence nucl.ot.d.que de 
— - n::.:rerr"e^;.pe q.„o..que r.rc,v.al 

.elon l.une quelconque ^ /^^^--^^-^.tr e„«e deu^ 

ccprenant un frequent '--^^^■'"^^^^^nrr.qion LTR et 
„ces —dan. 

^.aq.en. nu.l..que ..ns.l.u. par ou 

ccprenant la sequence SEQ ID ^^V 30,,- 

1/ Materiel nuclSique de type rei;rov 



20 



25 



35 
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nucleotidique f onctionnelle codant pour au moins une 
proteine retrovirale • 

6/ Materiel nucleique selon I'une quelconque des 
revendications 1 et 4 , comprenant au moins une sequence 
5 nucleotidique de regulation. 

7/ Fragment nucleotidique d ' au moins 100 bases, 
comprenant une sequence nucleotidique choisie dans le 
groupe comprenant : 

a) toutes les sequences nucleotidiques , partielles 
10 et totales d'un materiel nucleique selon 1 • une quelconque 

des revendications 1 a 6 

b) toutes les sequences nucleotidiques , partielles 
et totales d'un clone choisi dans le groupe incluant les 
clones : 



15 




cl. 6A2 


(SEQ 


ID 


NO: 


1) 






cl. 6A1 


(SEQ 


ID 


NO: 


2) 






C1.7A16 


(SEQ 


ID 


NO: 


3) 






cl.Pi22 


(SEQ 


ID 


NO: 


4) 






cl.24.4 


(SEQ 


ID 


NO: 


5) 


20 




C1.C4C5 


(SEQ 


ID 


NO: 


6) 






C1.PH74 


(SEQ 


ID 


NO: 


7) 






C1.PH7 


(SEQ 


ID 


NO: 


8) 






cl.PiST 


(SEQ 


ID 


NO: 


9) 






cl.44 . 4 


(SEQ 


ID 


NO: 


10) 


25 




HERV-W 


(SEQ 


ID 


NO: 


11) 






cl. 6A5 


(SEQ 


ID 


NO: 


12) 






C1.7A20 


(SEQ 


ID 


NO: 


13) 






C1.7A21 


(SEQ 


ID 


NO: 


14) 






LTR 


(SEQ 


ID 


NO: 


15) 



30 c) les sequences respectivement complementaires 

aux sequences selon a) et b) 

d) les sequences respectivement equivalentes aux 
sequences selon a) a c) , notamment les sequences 
nucleotidiques presentant, pour toute suite de 100 

35 monomeres contigus, au moins 50%, et de preference au 
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v^^n^c Qn?- d'homologie avec les 
laoins 70%, par exeinple au moms 90 o a nom y 

seciuences a) a c) . . -^n 
8/ sonde nucl6ique de detection d'un material 
nucl*l<jue, insSre ou non dans un acide nuclelque, 
3 rracLli^e en ce .u.elXe est su.cepti.Xe de py.r.der 
.p.ci.l,ue.ent su. un .at.riel n.cl..,ue .elo un 
quelconque des revendlcations i a 6, ou un 
nucleigue selon la revendication 7. 

,/ sonde selon la revendication 8, caractari.ee an 

10 ce au'elle comprend un marqueur. 

10/ Amorce nucl^ique pour 1 ■ amplification par 
polymerisation d'un ARN ou d'un ADK, caract.ris.e an ca 
qu-alle comprend une sequence nucl4otidiqua susceptible de 
l.nybridar sp.citiquement sur un materiel nuclaique salon 
,3 l.una qualconqua des revendlcations 1 a 6, ou un fraqment 
nucleioua selon la revendication 7. 

11/ sonde nucl.ique ou amorce nucleiqua 
caract6ris.a an ce qu.elle est constitute par una s.quanc 
nucieotidique choisia dans la qroupa mcluant 

90 SEQ ID NOs: 16 a 28. ^ 

12/ ARN ou ADN, et notaTnment vecteur de 
replication, co.prenant un fragment nucl.otidique selon la 

revendication 7. lecture ouvert 

13/ Peptide code par tour, caate 
.5 appartenant a un fragment nucl.otidique 

revendication 7, notamment polypeptide, par example 
oUqopeptide formant un determinant antiq.niqua reconnu 
^ar des sara da patients affect.s par une maladie auto- 
immune, ou una patholoqie qui lui ast associ.a, ou par das 
30 ;rian;es ayant una qrossessa pat.oloqiqua ou un insuccas 

de ^"^^^11^-^ revendication 13, caract.ris. 

en ca qu-il est cod. par un fragment nucl.otidiqua 
compLnant un cadre da lecture ouvert codant pour une ou 
35 des proteines ENV retrovirales . 
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15/ Utilisation d'un materiel nucleique selon les 
revendications l a 6, ou d'un fragment nucleotidique selon 
la revendication 1 , ou d'un peptide selon la revendication 
13 ou 14, comme marqueur moleculaire d'une maladie auto- 
5 immune ou d'une pathologie qui lui est associee, ou d'une 
grossesse pathologique ou d'un insucces de grossesse. 

16/ Utilisation d'un materiel nucleique selon les 
revendications 1 a 6, ou d'un fragment nucleotidique selon 
la revendication 7, comme marqueur chromosomique d'une 

10 susceptibilite a une maladie auto-immune ou d'une 
pathologie qui lui est associee, ou d'un risque d'une 
grossesse pathologique ou d'un insucces de grossesse* 

17/ Utilisation d'un materiel nucleique selon les 
revendications 1 a 6, ou d'un fragment nucleotidique selon 

15 la revendication 1 , comme marqueur de proximite d'un gene 
de susceptibilite a une maladie auto-immune ou a une 
pathologie qui lui est associee, ou a un risque d'une 
grossesse pathologique ou d'un insucces de grossesse. 

18/ Precede de marquage moleculaire d'une maladie 

2 0 auto-immune ou d'une pathologie qui lui est associee, 
d'une grossesse pathologique ou d'un insucces de 
grossesse, caracterise en ce qu ' on identifie et/ou 
quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique 

25 selon la revendication 7, soit sous forme d'ARN, soit sous 
forme d'ADN, 

19/ Precede selon la revendication 18, caracterise 
en ce qu'on detecte dans ledit materiel biologique 
corporel, des cellules exprimant le fragment nucleotidique 
30 selon la revendication. 

2 0/ Composition diagnostique ou therapeutique 
comprenant un materiel nucleique selon les revendications 
1 a 6, ou un fragment nucleotidique selon la revendication 
7, ou un peptide selon la revendication 13 ou 14. 

35 
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ORFl: ENV (53 8 AA) FIG 6 
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MGLPYHIFLCSVLSPCFTLTAPPPCRCMTSSSPHPEFLWRMQRPGNIDAPSYRSLSKGTP 60 
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R 

• • • • 
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Alianement ORF2 et Rex PLLV-L 
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LISTAGE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 

5 (i) DEPOSANT: 

(A) NOM: BIO MERIEUX 

(B) RUE: CHEMIN DE L * ORME 

(C) VILLE: MARCY L ' ETOILE 
(E) PAYS: FRANCE 

10 (F) CODE POSTAL: 69280 

(ii) TITRE DE INVENTION: MATERIEL NUCLEIQUE DE TYPE GENOMIQUE 

RETROVIRAL ENDOGENE, ASSOCIE A UNE MALADIE AUTO-IMMUNE ET/OU A DES 
PERTURBATIONS DE LA GROSSESSE ; UTILISATION EN TANT QUE MARQUEUR 



15 



(iii) NOMBRE DE SEQUENCES: 35 



(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
20 (B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 



2 5 (2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1321 paires de bases 

(B) TYPE: nucleotide 

3 0 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
3 5 (iii) HYPOTHETIQUE: NON 
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2 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

CAACAATCGG GATATAAACC CAGGCATTCG AGCTGGCAAC AGCAGCCCCC CTTTGGGTCC 60 

5 

CTTCCCTTTG TATGGGAGCT GTTTTCATGC TATTTCACTC TATTAAATCT TGCAACTGCA 120 

CTCTTCTGGT CCATGTTTCT TACGGCTCGA GCTGAGCTTT TGCTCACCGT CCACCACTGC 180 

10 TGTTTGCCAC CACCGCAGAC CTGCCGCTGA CTCCCATCCC TCTGGATCCT GCAGGGTGTC 240 

CGCTGTGCTC CTGATCCAGC GAAGCGCCCA TTGCCGCTCC CAATTGGGCT AAAGGCTTGC 300 

CATTGTTCCT GCACGGCTAA GTGCCTGGGT TTGTTCTAAT TGAGCTGAAC ACTAGTCACT 360 

15 

GGGTTCCATG GTTCTCTTCT GTGACCCACG GCTTCTAATA GAACTATAAC ACTTACCACA 420 

TGGCCCAAGA TTCCATTCCT TGGAATCCGT GAGGCCAAGA ACTCCAGGTC AGAGAATACG 480 

20 AAGCTTGCCA CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT 540 

TGGGAGCTCT GTGAGCAAGG ACCCCCCGGT AACATTTTGG CAACCACGAA CGGACATCCA 600 

AAGTGATGGG AAACGTTCCC CGCAAGACAA AAACGCCCCT AAGACGTATT CTGGAAAATT 660 

25 

GGGAACAATT TGACCCTCAG ACACT7VAGAA AGAAACGACT TATATTCTTC TGCAGTGCCG 720 

CCTGGCACTC CTGAGGGAAG TATAAATTAT AACACCATCT TACAGCTAGA CCTCTTTTGT 780 

3 0 AGAAAAGGCA AATGGAGTGA AGTGCCATAA GTACAAACTT TCTTTTCATT AAGAGACAAC 840 

TCACAATTAT GTAAAAAGTG TGATTTATGC CCTACAGGAA GCCTTCAGAG TCTACCTCCC 900 

TATCCCAGCA TCCCCGACTC CTTCCCCACT TAATAAGGAC CCCCCTTCAA CCCAAATGGT 960 

35 

CCAAAAGGAG ATAGACAAAA GGGTAAACAG TGAACCAAAG AGTGCCAATA TTCCCCAATT 1020 
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ATGACCCCTC CAAGCAGTGG GAGGAAGAGA ATTCGGCCCA GCCAGAGTGC ATGTGCCTTT 1080 

TTCTCTCCCA GACTTAAAGC AAATAAAAAC AGACTTAGGT AAATTCTCAG ATAACCCTGA 1140 

5 

TGGCTATATT GGTGTTTTAC TVAGGGTTAGG ACAATTCTTT GATCTGACAT GGAGAGATAT 1200 

ATATGTCACT GCTAAATCAG ACACTAACCC CAAATGAGAG AAGTGCCACC ATAACTGCAG 1260 

10 CCTGAGAGTT TGGCGATCTC TGGTATCTCA GTCAGGTCAA TGATAGGATG ACAACAGAGG 1320 



1321 



15 (2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2938 paires de bases 

(B) TYPE: nucleotide 

2 0 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

25 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

CAACGACGGA CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA 60 

30 

CGTATTCTGG AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA 120 
TTCTTCTGCA GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA 180 
35 GCTAGACTTC TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT 240 
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TTCATTAAGA GACAACTCAC AATTATGTAA 
TCAGAGTCTA CCTCCCTATC CCAGCATCCC 
5 CTTCAACCCA AATGGTCCAA AAGGAGATAG 
CCAATATTCC CCAATTATGA CCCCTCCCAA 
GAGTGCATGT GCTTTTTCTT CTCCCAGACT 

10 

TCTCAGATAA TCCTGATGGC TATATTGATG 
TGACATGGAG AGATATAATG TCACTGCTAA 
15 CCACCATAAC TGCAGCCTGA GAGTTTGGCG 
GGATGACAAC AGAGGAAAGA GATGATCCCC 
CTCATTGGGG ACACAGAAAT CAGTAACATG 

20 

TGTGTGCTAC AAGGACTAAG GAAAACTACG 
CACCATAACA CAGGGGAAGG GAAGAAAATC 
25 CATTGAGGAA GCGTGCCTCT CTGTCACCTG 
GTAAGTTTAT CACTCAGTCA GCTGCAGACA 
CCCGGAGCAA AACTTAGAAA CCCTATTGAA 

30 

TCAGGAGGAG CAGGCGGAAC AGGACAAACG 
TGACCCTCAG GCAAGTGGAC TTTGGAGGCT 
35 TGCCTAATAG GGCTTGCTTC CAGTGCGGTC 
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4 

AAAGTGTGAT TTATGCCCTA CAGGAAGCCT 300 
CGACTCCTTC CCCAACTAAT AAGGACCCCC 360 



ACAAAAGGGT AAACAGTGAA CCAAAGAGTG 420 



GCAGTGGGAG GAAGAGATTC GGCCCAGCCA 480 



TAAAGCAAAT AAAAACAGAC TTAGGTAAAT 540 
TTTTACAAGG GTTAGGACAA TTCTTTGATC 600 



ATCAGACACT AACCCCAAAT GAGAGAAGTG 660 



ATCTCTGGTA TCTCAGTCAG GTCAATGATA 7 20 



ACAGCCAGCA AGCAGTTCCC AGTCTASACC 780 



GGAGATTGGT GCTGCAGACA TTTGCTAACT 840 



AAGAAAATCT ACGAATTACT CAATGATGTC 900 



CTACTGCCTT TCTGGAGAGA CTAAGGGAGG 960 



ACTCTTCTGA AGGCCAACTA ATCTTAAAGC 1020 



TTAGA7VAAAA CTTCAAAAGT CTGCCGTAGG 1080 



CTTGGCAACY TCGGTTTTTT ATAATAGAGA 1140 



GGATTAAAAA AAAGGCCACC GCTTTAGTCA 1200 



CTGGAAAAGG GAAAAGCTGG GCAAATTGAA 12 60 



TACAAGGACA CTTTAAAAAA GATTGTCCAA 1320 
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GTAGAAGTAA GCCGCCCCTT CGTCCATGCC CCTTATTTCA AGGGAATCAC TGGAAGGCCC 1380 

ACTGCCCCAG GGGACAAAGG TCTTTTGAGT CAGAAGCCAC TAACCAGATG ATCCAGCAGC 1440 

5 AGGACTGAGG GTGCCTGGGG CAAGCGCCAT CCCATGCCAT CACCCTCACA GAGCCCTGGG 1500 

TATGCTTGAC CATTGAGGGC CAGGAAGGTT GTCTCCTGGA CACTGGTGCG GTCTTCTTAG 1560 

TCTTACTCTT CTGTCCCGGA CAACTGTCCT CCAGATCTGT CACTATCTGA GGGGGTCCTA 1620 

10 

AGACGGGCAG TCACTAGATA CTTCTCCCAG CCACTAAGTT ATGACTGGGG AGCTTTATTC 1680 

TTTTCACATG CTTTTCTAAT TATGCTTGAA AGCCCCACTA CCTTGTTAGG GAGAGACATT 1740 

15 CTAGCAAAAG CAGGGGCCAT TATACACCTG AACATAGGAG T^GGTVACACC CGTTTGTTGT 1800 

CCCCTGCTTG AGGT^GGAAT TAATCCTGAA GTCTGGGCAA CAGT^GGACA ATATGGACGA 1860 

GCAAAGAATG CCCGTCCTGT TCAAGTTAAA CTAAAGGATT CCACTTCCTT TCCCTACCAA 1920 

20 

AGGCAGTACC CCCTCAGACC CAAGGCCCAA CAAGGATTCC AAAAGATTGT TAAGGACTTA 1980 

AAAGCCCAAG GCTTAGTAAA ACCATGCATA ACTCCCTGCA GTAATTCCGT AGTGGATTGA 2040 

25 GGAGGCACAG AAACCCAGTG GACAGTGGAG GGTTAGTGCA AGATCTCAGG ATTATCAATG 2100 

GAGGCCGTTG TCCTTTTATA CCCAGCTGTA CCTAGCCCTT ATACTGTGCT TTCCC7VAATA 2160 

CCAGAGGAAG CAGAGTGGTT TACACTCCTG GACCTTAAGG ATGCCTTCTT CTGCATCCCT 2220 

30 

GTACATCCTG ACTCTCAATT CTTGTTTGCC TTTGAAGATA CTTCAAACCC AACATCTCAA 2280 

CTCACCTGGA CTGTTTTACC CCAAGGGTTC AGGGATAGCC CCCATCTATT TGGCCAGGCA 2340 

3 5 TTAGCCCAAG ACTTGAGCCA ATCCTCATAC CTGGACACTT GTCCTTCGGT AGGTGGATGA 2400 
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6 

TTTACTTTTG GCCGCCCATT CAGAAACCTT GTGCCATCAA GCCACCCAAG CGCTCTTCAA 2460 

TTTCCTCGCT ACCTGTGGCT ACATGGTTTC CT^AACCAAAG GCTCAACTCT GCTCACAGCA 2520 

5 GGTTACTTAG GGCTAAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ACACATCCAG 2580 

CCTATACTGG CTTATCCTCA TCCCAAAACC CTAAAGCAAC TAAGGGGATT CCTTGGCGTA 2640 

ATAGGTTTCT GCCGAATVATG GATTCCCAGG TTTGGCGAAA TAGCCAGGTC ATTAAATACA 2 700 

10 

CTAATTAAGG AAACTCAGAA AGCCAATACC CATTTAGTAA GATGGACAAC TGAAGTAGAA 2760 

GTGGCTTTCC AGGCCCTAAC CCAAGCCCCA GTGTTAAGTT TGCCAACAGG GCAAGACTTT 2820 

15 TCTTCATATG TCACAGAAAA AACAGGAATA GCTCTAGGAG TCCTTACACA GATCCGAGGG 2880 

ATGAGCTTGC AACCTGTGGC GTACCTGACT AAGGAAATTG ATGTAGTGGC AAAGGGTT 2938 



2 0 (2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1422 paires de bases 

( B ) TYPE : nuc leot ide 

25 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

3 0 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

TCAGGGATAG CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGT CAGTTATCAT 60 

35 

ACCTGGACAC TCTTGTCCTT CAGTATGTGG ATGATTTACT TTTAGCTGCC TGTTCAGAAA 120 
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CCTTGTGCCA TCAAGCCACC CAAGCACTCT 

TTTCCAAAGA GAAGCTCAGC TCTGCTCACA 

5 

CAAAGGCACC AAGGCCCTCA GTGAGGAATG 

CAAAACCCTA AAGCAACTAA GAGAGTTCCT 

10 TCCCCAGGTA TGGCAAAATA GCCAGGCCAT 

CCAATACCCA TTTAATAAGA TGGATACCTG 

AAGGCCTTAA ACCCAAGTCC CAGTGTTAAG 

15 

CATCACAGAA AAAAACAGAA ACAGCTCTGG 

TGCAACCCAT GGCATACCTG AGTAAGGAAA 

2 0 GTTTATGGGT AGTGGTGGCA GTAGCAGTTG 

GGAGAGATCT TACTGTGTGG ACATCTCATG 

ACTTGTGGCT GTCAGACAAC CGTTTACTTA 

25 

TGCTGCAACT GTGCACTTGT GCAACTCTTA 

ATAGAATATA ACTGTCAACA AATAATTTCT 

3 0 GAAGTTCCCT TGACTGATCC TGACCTTCAA 

AAAAGGACTT CAAAAGCGGG GTATGCAGTG 

CCCTCACTCC AGGAACTAGT GCTTAGCTGG 

35 

AATTAGGAGA AGGAAAAAGG GTAAATATAT 
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7 



TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 

GCAGGTTAAA TACTTAGGAC TAAGATTATC 240 

TATCCAGCCT ATACTGGCTT ATCCTCATCT 300 

TGGCATAACA GGCTTCTGCC GAATATGGAT 360 

TATATACAGT AATTAAGGAA ACTCAGAAAG 420 

AAGCCAAAGT GGCTTTCCAG GCCCCTAAAG 480 

CTTGCCAACG GGGCAAGACT TTTCTTTATA 540 

GAGTCCTTAC ACAGGTCCAA GGGACGAGCT 600 

CTGATGTAGT GGCAAAGGGT TGGCTTCATT 660 

TAGTATCTGA AGCAGTTAAA AT7VATACAGG 720 

AGGTGAACAG CATACTCACT GCTAAAGGAG 780 

AATATCAGGC TCTATTACTT GAAAGGCCAG 840 

ACCCAGTCNC ATTTCTTCCA GACAATGAAG 900 

C7VAACCTATG CCACTCGAGG GGACCTTCTA 960 

CTTGTATACT GATGGAAGTT CCTTTGTAGA 1020 

GTCAGTGATA ATGGAATATT TGAAAGTATC 1080 

CAGAACTAAT AGCCTTCATT GGGGCACTAG 1140 

ATACAGACTC TGAGTATGCT CACCTAGTCN 1200 
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TCCATGCCCA TGAGGCAATA TGCAGAGAAA GGGAATTCCT AACTTCCGAG GGAACACCTA 1260 

TCACACATCA GGAAGCCATT AGGAGATTAT TACTGGCAGT ACAGAAACCT AAAGAGGTGG 1320 

5 

AAGTCTTACA CTGCTGGGGT CATCAGAAAG GAAAGAAAAG GGAAATAGAA GGGAATTGCC 1380 

AAGCAGATAT TGAAGCAAAA AGAGCTGCAA GGCAGGACCC TC 1422 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2006 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

20 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
25 ATGCAGTGGT CAGTGATAAT GGAATACTTG AAAGTAATCC CCTCACTCCA GGAACTAGTG 60 
CTCAGCTAGC AGAACTAATA GCCCTCACTT GGGCACTAGA ATTAGGAGAA GAAAAAAGGG 120 
CAAATATATA TACAGACTCT AAATATGCTT ACCTAGTCCT CCATGCCCAT GCAGCAATAT 180 

30 

GGAAAGAAAG GGAATTCCTA ACTTCTGAGA GAACACCTAT CA7VACATCAG GAAGCCATTA 240 
GGAAATTATT ATTGGCTGTA CAGAAACCTA AAGAGGTGGC AGTCTTACAC TGCCGGGGTC 300 
3 5 ATCANAAAGG AAAGGAAAGG GAAAATACTT TTGCCTGCAA CTATCCAATG GAAATTACTT 360 
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AAAACCCTTC ATCAAACCTT TCACTTAGGC 
TTATTTACTG GACCAGGCCT TTTCAAAACT 
5 TGCCAAAAAA ATAATCCCCT GCCTCATCGC 
CATTACCCTG AAAAAAACTG GCAACTGATT 
AGTATCTACT AGTCTGGGTA AATACTTTCA 

10 

CAGAAAAGGC CCAAGAGGTA ATAAAGGCAC 
TTCCCCGAGG CTTACAGAGT GACAATAGCC 
15 TATCCCAGGC GTTAGGTATA CGATATCACT 
GGAAGGTCGA GAAAATGAAT GAAATACTCA 
CCCACCTCAC ATGGCCTGCT CTGTTGCCTA 

20 

AAAAAGCAGG ACTTAGCCCA TACGAAATGC 
TTGTGCTTGA CCCAAGACAG CCAACTTAGT 
25 ACAAGTTCTT AAAACATTAC AAGGAACCTA 
CCCTTGTGAC ATGGTATTAG TCAAGTCCCT 
CTGGGAAGGA CCCTACCCAG TCATTTTATT 

30 

GGTCTTGGAT ACATCACACT TGAGTCAAAT 
CAGGAGACAA CGCTAGCTAT TCCTGTGAAC 
3 5 AACAACCAGG AGGAAAGTAA CTAAAATCAT 
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ATCGATAGCA CCCATCAAAT GGCCAAATCA 420 



ATCAAGCAAA TATTCAGGGC CTGTGAATTG 480 



CAAGCTCCTT CAGGAAAACA AAAAACAGGC 540 



TTACCCACAA GCCCAAACCT CAGGGATTTC 600 



CGGGTTGGGC AAAGGCCTTC CCCTGTAGGA 660 



TAGTTCATGA AATAATTCCC AGATTCGGAC 720 



CTGCTTTCCA GGCCACAGTA ACCCAGGGAG 7 80 



TACACTGCGC CTGAAGGCCA CAGTCCTCAG 840 



AAGGACATCT AA7VAAAGCAA ACCCAGGAAA 900 



TAGCCTTAAA AAGAATCTGC AACTTTCCCC 960 



TGTATGGAAG GCCCTTCATA ACCAATGACC 1020 



TGCAGACATC ACCTCCTTAG CCAAATATCA 1080 



TCCCTGAGAA GAGGGAAAAG AACTATTCCA 1140 



TCTCTCTAAT TCCCCATCCC TAGATACATC 1200 



TACCCCAACT GCGGTTAAAG TGGCTGGAGT 1260 



CCTGGATACT GCCAAAGGAA CCTGAAAATC 1320 
CTCTAGAGGA TTTGCGCCTG CTCTTCAAAC 1380 
AAATCCCCCA TGGCCCTCCC TTATCATATT 1440 
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TTTCTCTTTA CTGTTCTTTT ACCCTCTTTC ACTCTCACTG CACCCCCTCC ATGCCGCTGT 1500 

ATGACCAGTA GCTCCCCTTA CCAAGAGTTT CTATGGAGAA TGCAGCGTCC CGGAAATATT 1560 

5 GATGCCCCAT CGTATAGGAG TCTTTCTAAG GGAACCCCCA CCTTCACTGC CCACACCCAT 1620 

ATGCCCCGCA ACTGCTATCA CTCTGCCACT CTTTGCATGC ATGCAAATAC TCATTATTGG 1680 

ACAGGAAAAA TGATTAATCC TAGTTGTCCT GGAGGACTTG GAGTCACTGT CTGTTGGACT 1740 

10 

TACTTCACCC AAACTGGTAT GTCTGATGGG GGTGGAGTTC AAGATCAGGC AAGAGAAAAA 1800 

CATGTAAAAG AAGTAATCTC CCAACTCACC CGGGTACATG GCACCTCTAG CCCTACAAAG 1860 

15 GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA TACTCGCCTG GTAAGCCTAT 1920 

TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA 1980 

TATGCCTCCC CCTGAACTTC AAGCCA 2006 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 1948 paires de bases 

( B ) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 0 (ii) TYPE DE MOLECULE: ARNm (en ADN) 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

35 

ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 
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CACTGCTGTT TGCCACCACC GCANACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

5 

GCTTGCCATT GTNCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

NTCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

10 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG GCAAGAACTC CAGGTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC ATCTTGGAAG TGGTTCACCA 420 

CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CACGAACGGA 480 

15 

CATCCAAAGT GATACATCCT GGGAAGGACC CTACCCAGTC ATTTTATCTA CCCCAACTGC 540 

GGTTAAAGTG GCTGGAGTGG AGTCTTGGAT ACATCACACT TGAGTCAAAT CCTGGATACT 600 

20 GCCAAAGGAA CCTGAAAATC CAGGAGACAA CGCTAGCTAT TCCTGTGAAC CTCTAGAGGA 660 

TTTGCGCCTG CTCTTCAAAC AACAACCAGG AGGAAAGTAA CTAAAATCAT AAATCCCCAT 720 

GGCCCTCCCT TATCATATTT TTCTCTTTAC TGTTGTTTCA CCCTCTTTCA CTCTCACTGC 780 



ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC CTU^GAGTTTC TATGGAGAAT 840 

GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT CTTTGTAAGG GAACCCCCAC 900 

3 0 CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC TCTGCCACTC TTTGCATGCA 960 

TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT AGTTGTCCTG GAGGACTTGG 1020 

AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG TCTGATGGGG GTGGAGTTCA 1080 

35 

AGATCAGGCA AGAGAAAAAC ATGTAAAAGA AGTAATCTCC CAACTCACCC GGGTACATGG 1140 



25 
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CACCTCTAGC CCCTACAAAG GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA 1200 

TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA 1260 

5 

AAACCCTACT AACTGTTGGA TATGCCTCCC CCTG7VACTTC AGGCCATATG TTTCAATCCC 1320 

TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATAAAC ACCACTTCCG TTTTAGTAGG 1380 

10 ACCTCTTGTT TCCAATCTGG AAATAACCCA TACCTCAAAC CTCACCTGTG TAAAATTTAG 1440 

CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG GTAACTCCTC CCACAC/VAAT 1500 

AGTCTGCCTA CCCTCAGGAA TATTTTTTGT CTGTGGTACC TCAGCCTATC GTTGTTTGAA 1560 

15 

TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG CCCCCTATGG CCATCTACAC 1620 

TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC AACAAAAGAG TACCCATTCT 1680 

2 0 TCCTTTTGTT ATAGGAGCAG GAGTGCTAGG TGCACTAGGT ACTGGCATTG GCGGTATCAC 1740 

AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA AATGGGGACA TGGTVACGGGT 1800 

CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC CTAGCAGCAG TAGTCCTTCA 1860 

25 

AAATCGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG GGAACCTGTT TATTTTTAGG 1920 

GGAAGAATGC TGTTATTATG TTAATCAA 1948 

30 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1136 paires de bases 
35 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
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(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

CCATGGCCAT CTACACTGAA CAAGATTTAT ACAGTTATGT CATATCTAAG CCCCGCAACA 60 

AAAGAGTACC CATTCTTCCT TTTGTTATAG GAGCAGGAGT GCTAGGTGCA CTAGGTACTG 120 

GCATTGGCGG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAACTAAATG 180 

GGGACATGGA ACGGGTCGCC GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 240 

CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTCGCT AACCGCTGAA AGAGGGGGAA 300 

CCTGTTTATT TTTAGGGGAA GAATGCTGTT ATTATGTTAA TCAATCCGGA ATCGTCACTG 360 

AGAAAGTTAA AGAAATTCGA GATCGAATAC AACGTAGAGC AGAAGAGCTT CG/U^CACTG 420 

GACCCTGGGG CCTCCTCAGC CAATGGATGC CCTGGATTCT CCCCTTCTTA GGACCTCTAG 480 

CAGCTATAAT ATTGCTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAACTTTG 540 

TCTCTTCCAG AATCGAAGCT GTAAAACTAC AAATGGAGCC CAAGATGCAG TCCAAGACTA 600 

AGATCTACCG CAGACCCCTG GACCGGCCTG CTAGCCCACG ATCTGATGTT AATGACATCA 660 

AAGGCACCCC TCCTGAGGAA ATCTCAGCTG CACAACCTCT ACTACGCCCC AATTCAGCAG 720 

GAAGCAGTTA GAGCGGTCGT CGGCCAACCT CCCCAACAGC ACTTAGGTTT TCCTGTTGAG 780 

ATGGGGGACT GAGAGACAGG ACTAGCTGGA TTTCCTAGGC TGACTAAGAA TCCCTAAGCC 840 
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TAGCTGGGAA GGTGACCACA TCCACCTTTA AACACGGGGC TTGCAACTTA GTTCACACCT 900 

GACCAATCAG AGAGCTCACT AAAATGCTAA TTAGGCAAAG ACAGGAGGTA AAGAAATAGC 9 60 

5 CAATCATCTA TTGCATGAGA GCACAGCAGG AGGGACAATG ATCGGGATAT AAACCC7VAGT 1020 

CTTCGAGCCG GCAACGGCAA CCCCCTTTGG GTCCCCTCCC TTTGTATGGG AGCTCTGTTT 1080 

TCATGCTATT TCACTCTATT AAATCTTGCA GCTGCGAAAA AAAAAAAAAA AAAAAA 1136 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
15 (A) LONGUEUR: 2782 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

2 0 (ii) TYPE DE MOLECULE: ARNm (en AON) 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 



25 



ATGGGAGCTG TTTTCATGCT ATTTCACTCT ATTAAATCTT GCAACTGCAC TCTTCTGGTC 60 



CATGTTTCTT ACGGCTCGAG CTGAGCTTTT GCTCACCGTC CACCACTGCT GTTTGCCACC 120 

3 0 ACCGCAGACC TGCCGCTGAC TCCCATCCCT CTGGATCCTG CAGGGTGTCC GCTGTGCTCC 180 

TGATCCAGCG AAGCGCCCAT TGCCGCTCCC AATTGGGCTA /VAGGCTTGCC ATTGTTCCTG 240 

CACGGCTAAG TGCCTGGGTT TGTTCTAATT GAGCTGAACA CTAGTCACTG GGTTCCATGG 300 

35 

TTCTCTTCTG TGACCCACGG CTTCTAATAG AACTATAACA CTTACCACAT GGCCCAAGAT 360 
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TCCATTCCTT GGAATCCGTG AGGCCAACGA ACTCCAGGTC AGAGAATACG AAGCTTGCCA 420 

CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT TGGGAGCTCT 480 

5 

GTGAGCAAGG ACCCCCCGGT GACATTTTGG CGACCACCAA CGGACATCCC AAGTGATACA 540 

TCCTGGGAAG GACCCTACCC AGTCATTTTA TCTACCCCAA CTGCGGTTAA AGTGGCTGGA 600 

10 GTGGAGTCTT GGATACATCA CACTTGAGTC AAATCCTGGA TACTGCCAAA GGAACCTGAA 660 

AATCCAGGAG ACAACGCTAG CTATTCCTGT GAACCTCTAG AGGATTTGCG CCTGCTCTTC 720 

AAAC7VACAAC CAGGAGGAAA GTAACTAAAA TCATAAATCC CCATGGGCCT CCCTTATCAT 780 

15 

ATTTTTCTCT GTAGTGTTCT TTCACCCTGT TTCACTCTCA CTGCACCCCC TCCATGCCGC 840 

TGTATGACCA GTAGCTCCCC TCACCCAGAG TTTCTATGGA GAATGCAGCG TCCCGGAAAT 900 

2 0 ATTGATGCCC CATCGTATAG GAGTCTTTCT AAGGGAACCC CCACCTTCAC TGCCCACACC 960 

CATATGCCCC GCAACTGCTA TCACTCTGCC ACTCTTTGCA TGCATGCAAA TACTCATTAT 1020 

TGGACAGGAA AAATGATTAA TCCTAGTTGT CCTGGAGGAC TTGGAGTCAC TGTCTGTTGG 1080 

25 

ACTTACTTCA CCCAAACTGG TATGTCTGAT GGGGGTGGAG TTCAAGATCA GGCAAGAGAA 1140 

AAACATGTAA AAGAAGTAAT CTCCCAACTC ACCGGGGTAC ATGGCACCTC TAGCCCCTAC 1200 

3 0 AAAGGACTAG ATCTCTCAAA ACTACATGAA ACCCTCCGTA CCCATACTCG CCTGGTAAGC 12 60 

CTATTTAATA CCACCCTCAC TGGGCTCCAT GAGGTCTCGG CCCAAAACCC TACTAACTGT 1320 

TGGATATGCC TCCCCCTGAA CTTCAGGCCA TATGTTTCAA TCCCTGTACC TGAACAATGG 1380 

35 

TVACAACTTCA GCACAGAAAT AAACACCACT TCCGTTTTAG TAGGACCTCT TGTTTCCAAT 1440 
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GTGGAAATAA CCCATACCTC AAACCTCACC TGTGTAAAAT TTAGCAATAC TACATACACA 1500 

ACCAACTCCC AATGCATCAG GTGGGTAACT CCTCCCACAC AAATAGTCTG CCTACCCTCA 1560 

5 

GGAATATTTT TTGTCTGTGG TACCTCAGCC TATCGTTGTT TGAATGGCTC TTCAGAATCT 1620 

ATGTGCTTCC TCTCATTCTT AGTGCCCCCT ATGACCATCT ACACTGAACA AGATTTATAC 1680 

10 AGTTATGTCA TATCTAAGCC CCGCAACAAA AGAGTACCCA TTCTTCCTTT TGTTATAGGA 1740 

GCAGGAGTGC TAGGTGCACT AGGTACTGGC ATTGGCGGTA TCACAACCTC TACTCAGTTC 1800 

TACTACAAAC TATCTCAAGA ACTAAATGGG GACATGGAAC GGGTCGCCGA CTCCCTGGTC 1860 

15 

ACCTTGCAAG ATCAACTTAA CTCCCTAGCA GCAGTAGTCC TTCGAAATCG AAGAGCTTTA 1920 

GACTTGCTAA CCGCTGAGAG AGGGGGAACC TGTTTATTTT TAGGGGAAGA ATGCTGTTAT 1980 

2 0 TATGTTAATC AATCCGGAAT CGTCACTGAG AAAGTTGAAG AAATTCCAGA TCGAATACAA 2040 

CGTATAGCAG AGGAGCTTCG AT^CACTGGA CCCTGGGGCC TCCTCAGCCG ATGGATGCCC 2100 

TGGATTCTCC CCTTCTTAGG ACCTCTAGCA GCTATAATAT TGCTACTCCT CTTTGGACCC 2160 

25 

TGTATCTTTG ACCTCCTTGT TAACTTTGTC TCTTCCAGAA TCGAAGCTGT GAAACTACAA 2220 

ATGGAGCCCA AGATGCAGTC CAAGACTAAG ATCTACCGCA GACCCCTGGA CCGGCCTGCT 2280 

3 0 AGCCCACGAT CTGATGTTAA TGACATCAAA GGCACCCCTC CTGAGGAAAT CTCAGCTGCA 2340 

CAACCTCTAC TACGCCCCAA TTCAGCAGGA AGCAGTTAGA GCGGTGGTCG GCCAACCTCC 2400 

CCAACAGCAC TTAGGTTTTC CTGTTGAGAT GGGGGACTGA GAGACAGGAC TAGCTGGATT 2460 

35 

TCCTAGGCTG ACTAAGAATC CTTAAGCCTA GGTGGGAAGG TGACCACATC CACCTTTAAA 2520 
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CACGGGGCTT GCAACTTAGC TCACACCTGA CCAATCAGAG AGCTCACTAA AATGCTAATT 2 580 

AGGCAAAGAC AGGAGGTAAA G7VAATAGCCA ATCATTTATT GCCTGAGAGC ACAGCAGGAG 2640 

5 

GGACAATGAT CGGGATATAA ACCCAAGTTT TCGAGCCGGC AACGGCAACC CCCTTTGGGT 2700 

CCCCTCCCTT TGTATGGGAG CTCTGTTTTC ATGCTATTTC ACTCTATTAA ATCTTGCAAC 27 60 

10 TGCAAAAAAA AAAAAAAAAA AA 2782 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 666 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

20 

(ii) TYPE DE MOLECULE: ARNm (en ADN ) 
(iii) HYPOTHETIQUE: NON 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

TGTCCGCTGT GCTCCTGATC CAGCGAGGCG CCCATTGCCG CTCCCAATTG GGCTAAAGGC 60 
TTGCCATTGT TCCTGCACGG CTAAGTGCCT GGGTTTGTTC TAATTGAGCT GAACACTANT 120 

30 

CACTGGGTTC CATGGTTCTC TTCTGTGACC CACGGCTTCT AATATAACTA TAACACTTAC 180 
CACATGGCCC AAGATTCCAT TCCTTGGAAT CCGTGAGGCC AAGAACTCCA GGTCAGAGAA 240 
3 5 TACGAGGCTT GCCACCATCT TGGAAGCGGC CTGCTACCAT CTTGGAAGTG GTTCACCACC 300 
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ATCTTGGGAG CTCTGTGAGC AAGGACCCCC CGGTAACATT TTGGCAACCA CGAACGGACA 360 
TCCAAAGTGA ATCGAAGCTG TAAAACTACA AATGGAGCCC AAGATGCAGT CCAAGACTAA 420 
5 GATCTACCGC AGACCCCTGG ACCGGCCTGC TAGCCCACGA TCTGATGTTA ATGACATCAA 480 
AGGCACCCCT CCTGAGGAAA TCTCAGCTGC ACAACCTCTA CTACGCCCCA ATTCAGCAGG 540 
AAGCAGTTAG AGCGGTCGTC GGCCAACCTC CCCAACAGCA CTTAGGTTTT CCTGTTGAGA 600 

10 

TGGGGGACTG AGAGACAGGA CTAGCTGGAT TTCCTAGGCT GACTAAGAAT CCCTAAGCCT 660 
AGCTGG 666 

15 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3372 paires de bases 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN ) 

25 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
30 GACTTCCCAA ATACCAGAGG AAGCAGAGTG GTTTACAGTC CTGGACCTTC AGGATGCCTT 60 
CTTCTGCATC CCTGTACATC CTGACTCTCA ATTCTTGTTT GCCTTTGAAG ATACTTCAAA 120 
CCCAGCATCT CAACTCACCT GGACTATTTT ACCCCAAGGG TTCAGGGATA GTCCCCATCT 180 

35 

ATTTGGCCAG GCATTAGCCC AAGACTTGAG CCAATCCTCA TACCTGGACA CTTGTCCTTC 240 
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GGTAGGTGGA TGATTTACTT TTGGCCGCCC ATTCAGAAAC CTTGTGCCAT CAAGCCACCC 300 

TU^GCGCTCTT CT^TTTCCTC GCTACCTGTG GCTACATGGT TTCCAAACCA AAGGCTCAAC 360 

5 

TCTGCTCACA GCAGGTTACT TAGGGCTAAA ATTATCCAAA GGCACCAGGG CCCTCAGTGA 420 

GGAACACATC CAGCCTATAC TGGCTTATCC TCATCCCAAA ACCCTAAAGC AACTAAGGGG 480 

10 ATTCCTTGGC GTAATAGGTT TCTGCCGAAA ATGGATTCCC AGGTATGGCG AAATAGCCAG 540 

GTCATTAAAT ACACTAATTA AGGAAACTCA GAAAGCCAAT ACCCATTTAG TAAGATGGAC 600 

AACTGAAGTA GAAGTGGCTT TCCAGGCCCT AACCCAAGCC CCAGTGTTAA GTTTGCCAAC 660 

15 

AGGGCAAGAC TTTTGTTCAT ATGTCACAGA AAAAACAGGA ATAGCTCTAG GAGTCCTTAC 720 

ACAGATCCGA GGGATGAGCT TGCAACCTGT GGCACACCTG ACTAAGGAAA TTGATGTAGT 780 

2 0 GGCAAAGGGT TGACCTCATT GTTTACGGGT AGTGGTGGCA GTAGCAGTCT TAGTATCTGA 840 

AGCAGTTAAA ATAATACAGG GAAGAGATCT TACTGTGTGG ACATCTCATG ATGTGT^TGG 900 

CATACTCACT GCTAAAGGAG ACTTGTGGCT GTCAGACAAC TGTTTACTTA AATGTCAGGC 960 

25 

TCTATTACTT GAAGGGCCAG TGCTGCGACT GTGCACTTGT GCAACTCTTA ACCCAGCCAC 1020 

ATTTCTTCCA GACAATGAAG AAAAGATAAA ACATAACTGT CAACAAGTAA TTTCTCAAAC 1080 

30 CTATGCCACT CGAGGGGACC TTTTAGAGGT TCCTTTGACT GATCCCGACC TCAACTTGTA 1140 

TACTGATGGA AGTTCCTTTG TAGAAAAAGG ACTTCGAAAA GTGGGGTATG CAGTGGTCAG 1200 

TGATAATGGA ATACTTGAAA GTAATCCCCT CACTCCAGGA ACTAGTGCTC AGCTAGCAGA 1260 

35 

ACTAATAGCC CTCACTTGGG CACTAGAATT AGGAGAAGAA AAAAGGGCAA ATATAATACA 1320 
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GACTCTAAAT ATGCTTACCT AGTCCTCCAT GCCCATGCAG CAATATGGAA AGAAAGGGAA 1380 

TTCCTAACTT CTGAGAGAAC ACCTATCAAA CATCAGGAAG CCATTAGGAA ATTATTATTG 1440 

5 

GCTGTACAGA AACCTAGAGA GGTGGCAGTC TTACACTGCC GGGGTCATCA CAAAGGAAAG 1500 

GAAAGGGAAA TACAAGAGAA CTGCCAAGCA TATATTGAAG CCAAAAGAGC TGCAAGGCAG 1560 

10 GACCCTCCAT TAGAAATGCT TATTAAACTT CCCTTAGTAT AGGGTAATCC CTTCCGGGAA 1620 

ACCAAGCCCC AGTACTCAGC AGGAGAAACA GAATGGGGAA CCTCACGAGG CAGTTTTCTC 1680 

CCCTCGGGAC GGTTAGCCAC TGAAGAAGGG AAAATACTTT TGCCTGCAAC TATCCAATGG 1740 

15 

ATVATTACTTA AAACCCTTCA TCAAACCTTT CACTTAGGCA TCGATAGCAC CCATCAGATG 1800 

GCCAAATCAT TATTTACTGG ACCAGGCCTT TTCAAAACTA TCAAGCAGAT AGTCAGGGCC 1860 

20 TGTGAAGTGT GCCAGAGAAA TAATCCCCTG CCTTATCGCC AAGCTCCTTC AGGAGAACAA 1920 

AGAACAGGCC ATTACCCTGG AGAAGACTGG CAACTGATTT TACCCACAAG CCCAAACCTC 1980 

AGGGATTTCA GTATCTACTA GTCTGGGTAG ATACTTTCAC GGGTTGGGCA GAGGCCTTCC 2040 

25 

CCTGTAGGAC AGAAAAGGCC CAAGAGGTAA TAAAGGCACT AGTTCATGAA ATAATTCCCA 2100 

GATTCGGACT TCCCCGAGGC TTACAGAGTG ACTVATAGCCC TGCTTTCCAG GCCACAGTAA 2160 

3 0 CCCAGGGAGT ATCCCAGGCG TTAGGTATAC GATATCACTT ACACTGCGCC TG7VAGGCCAC 2220 

AGTCCTCAGG GTU^GGTCGAG AAAATGAATG AAACACTCAA AGGACATCTA AAAAAGCAAA 2280 

CCCAGGAAAC CCACCTCACA TGGCCTGTTC TGTTGCCTAT AGCCTTAAAA AGAATCTGCA 2340 

35 

ACTTTCCCCA AAAAGCAGGA CTTAGCCCAT ACGAAATGCT GTATGGAAGG CCCTTCATAA 2400 



FEUILLE DE REMPLACEMENT (REGLE 26) 



wo 99/02696 




PCT/FR98/01442 



21 



CCAATGACCT TGTGCTTGAC CCAAGACAGC CAACTTAGTT GCAGACATCA CCTCCTTAGC 2460 

CAAATATCAA CAAGTTCTTA AAACATTACA AGGAACCTAT CCCTGAGAAG AGGAAAAGAA 2520 

5 

TATTCCACCC AAGTGACATG GTATTAGTCA AGTCCCTTCC CTCTAATTCC CCATCCCTAG 2580 

ATACATCCTG GGAAGGACCC TACCCAGTCA TTTTATCTAC CCCAACTGCG GTTAAAGTGG 2640 

10 CTGGAGTGGA GTCTTGGATA CATCACACTT GAGTCAAATC CTGGATACTG CCAAAGGAAC 2700 

CTGAAAATCC AGGAGACAAC GCTAGCTATT CCTGTGAACC TCTAGAGGAT TTGCGCCTGC 2 7 60 

TCTTCAAACA ACAACCAGGA GGAAAAATCG AAGCTGTAAA ACTACAAATG GAGCCCAAGA 2820 

15 

TGCAGTCCAA GACTAAGATC TACCGCAGAC CCCTGGACCG GCCTGTTAGC CCACGATCTG 2880 

ATGTTAATGA CATCAAAGGC ACCCCTCCTG AGGAAATCTC AGCTGCACAA CCTCTACTAC 2940 

2 0 GCCCCAATTC AGCAGGAAGC AGTTAGAGCG GTCGTCGGCC AACCTCCCCA ACAGCACTTA 3000 

GGTTTTCCTG TTGAGATGGG GGACTGAGAG ACAGGACTAG CTGGATTTCC TAGGCTGATT 3060 

AAGAATCCCT TVAGCCTAGCT GGGAAGGTGA CCACATCCAC CTTTAAACAC GGGGCTTGCA 3120 

25 

ACTTAGCTCA CACCTGACCA ATCAGAGAGC TCACTAAAAT GCTAATTAGG CAAAGACAGG 3180 

AGGTAAAGAA ATAGCCAATC ATTTATTGCC TGAGAGCACA GCAGGAGGGA CAATGATCGG 3240 

3 0 GATATAAACC CAAGTTTTCG AGCCGGCAAC GGCAACCCCC TTTGGGTCCC CTCCCTTTGT 3300 

ATGGGAGCTC TGTTTTCATG CTATTTCACT CTATTAAATC TTGCAACTGC AAAAAAAAAA 3360 

AAAAAAAAAA AA 3372 



35 
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(2) INFORMATIONS POUR LA SEQ ID NO: 10: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 



<A) LONGUEUR: 2372 paires de bases 



5 



(B) TYPE: nucleotide 



(C) NOMBRE DE BRINS : simple 



(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ARNm (en ADN ) 



10 



(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 



15 ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 

CACTGCTGTT TGCCACCACC GCAGACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

20 

GCTTGCCATT GTTCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

ATCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

25 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG CCAAGAACTC CAGGTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC GTCTTGGAAG TGGTTCACCA 420 

CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CAACGACGGA 480 

30 

CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA CGTATTCTGG 540 

AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA TTCTTCTGCA 600 

3 5 GTGCCGCCTG GCACTCCTGA GGGAAGTATA /VATTATAACA CCATCTTACA GCTAGACCTC 660 
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TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT TTCATTAAGA 720 

GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT TCAGAGTCTA 780 

5 CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC CTTC7VACCCA 840 

AATGGTCCAA AAGGAGATAG ACAAAAGGGT AAACAGTGAA CCAAAGAGTG CCAATATTCC 900 

CCAATTATGA CCCCTCCAAG CAGTGGGAGG AAGAGAATTC GGCCCAGCCA GAGTGCATGT 960 

10 

GCCTTTTTCT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT TCTCAGATAA 1020 

CCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC TGACATGGAG 1080 

15 AGATATAATG TCACTGCTAA ATCAGACACT AACCCCAAAT GAGAGAAGTG CCACCATAAC 1140 

TGCAGCCTGA GGGTTTGGCG TCTCTGGTAT CTCAGTCAGG TCAATGGATA NGGATGACAA 1200 

CAGAAGGAAA GANAATGATT CCCCACAGGC CAGCAGGCAG TTCCCAGTCT AGACCCTCAT 1260 

20 

TGGGACACAG AATCAGAACA TGGAGATTGG TGCTGCAGAC ATTTGCTAAC TTGTGTGCTA 1320 

GAAGGACTAA GGAAAACTAG GAAGAAGTCT ATGAATTACT CAATGATGTC CACCATAACA 1380 

25 CAGGGAAGGG AAGAAAATCC TACTGCCTTT CTGGAGAGAC TAAGGGAGGC ATTGAGGAAG 1440 

CGTGCCTCTC TGTCACCTGA CTCTTCTGAA GGCCAACTAA TCTTAT^GCG TAAGTTTATC 1500 

ACTCAGTCAG CTGCAGACAT TAGAAATVAAC TTCAAAAGTC TGCCGTAGGC CCGGAGCAAA 1560 

30 

ACTTAGAAAC CCTATTGAAC TTGGCAACCT CGGTTTTTTA TAATAGAGAT CAGGAGGAGC 1620 

AGGCGGAACA GGACATU^CGG GATTAAAAAA AAGGCCACCG CTTTAGTCAT GACCCTCAGG 1680 

35 CAAGTGGACT TTGGAGGCTC TGGAAAAGGG AAAAGCTGGG CAAATTGAAT GCCTAATAGG 1740 
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GCTTGCTTCC AGTGCGGTCT ACAAGGACAC TTTAAAAAAG ATTGTCCAAG TAGAAGTAAG 1800 

CCGCCCCTTC GTCCATGCCC CTTATTTCAA GGGAATCACT GGAAGGCCCA CTGCCCCAGG 1860 

5 GGACAAAGGT CTTTTGAGTC AGAAGCCACT AACCAGATGA TCCAGCAGCA GGACTGAGGG 1920 

TGCCTGGGGC 7VAGCGCCATC CCATGCCATC ACCCTCACAG AGCCCTGGGT ATGCTTGACC 1980 

ATTGAGGGCC AGGAAGGTTG TCTCCTGGAC ACTGGTGCGG TCTTCTTAGT CTTACTCTTC 2040 

10 

TGTCCCGGAC AACTGTCCTC CAGATCTGTC ACTATTCTGA GGGGGTCCNT AAGACGGGCA 2100 

GTCACTAGAT ACTTTTTCCC AGCCACTAAG TTATGAACTG GGGAGCTTTA TTCTTTTCAC 2160 

15 ATGCTTTTCT AATTATGCTT GAAAGCCCCA CTACCTTGTT AGGGAGAGAC ATTCTAGCAA 2220 

AAGCAGGGGC CATTATACAC CTGAACATAG GAGAAGGAAC ACCCGTTTGT TGTNCCCCTG 22 80 

CTTGAGGAAG GAATTAATCC TGAAGTCTGG GCAACAGAAG GACAATATGG ACGAGCCATVA 2340 

20 

GAATGCCCGT CCTGTTCAAG TTAAACTAAA GG 2372 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 



25 



(i) CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 7582 paires de bases 



(B) TYPE: nucleotide 



(C) NOMBRE DE BRINS: simple 



30 



(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ARNm (en ADN ) 



(iii) HYPOTHETIQUE: NON 



35 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
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CAACAATCGG 


GATATAAACC 


CAGGCATTCG 


AGCTGGCAAC 


AGCAGCCCCC 


CTTTGGGTCC 


60 




CTTCCCTTTG 


TATGGGAGCT 


GTTTTCATGC 


TATTTCACTC 


TATTAAATCT 


TGCAACTGCA 


120 




CTCTTCTGGT 


CCATGTTTCT 


TACGGCTCGA 


GCTGAGCTTT 


TGCTCACCGT 


CCACCACTGC 


180 


5 


TGTTTGCCAC 


CACCGCANAC 


CTGCCGCTGA 


CTCCCATCCC 


TCTGGATCCT 


GCAGGGTGTC 


240 




CGCTGTGCTC 


CTGATCCAGC 


GARGCGCCCA 


TTGCCGCTCC 


CAATTGGGCT 


AAAGGCTTGC 


300 




CATTGTNCCT 


GCACGGCTAA 


GTGCCTGGGT 


TTGTTCTAAT 


TGAGCTGAAC 


ACTANTCACT 


360 




GGGTTCCATG 


GTTCTCTTCT 


GTGACCCACG 


GCTTCTAATA 


KAACTATAAC 


ACTTACCACA 


420 




TGGCCCAAGA 


TTCCATTCCT 


TGGAATCCGT 


GAGGSCAACG 


AACTCCAGGT 


CAGAGAATAC 


480 


10 


GARGCTTGCC 


ACCATCTTGG 


AAGCGGCCTG 


CTACCRTCTT 


GGAAGTGGTT 


CACCACCATC 


540 




TTGGGAGCTC 


TGTGAGCAAG 


GACCCCCCGG 


TRACATTTTG 


GCRACCAMSR 


ACGGACATCC 


600 




MAAGTGATGG 


GAAACGTTCC 


CCGCAAGACA 


AAAACGCCCC 


TAAGACGTAT 


TCTGGARAAT 


660 




TGGGAMCAAT 


TTGACCCTCA 


GACACTAAGA 


AAGAAACGAC 


TTATATTCTT 


CTGCAGTGCC 


720 




GCCTGGCACT 


CCTGAGGGAA 


GTATAAATTA 


TAACACCATC 


TTACAGCTAG 


ACYTCTTTTG 


780 


15 


TAGA7UVAGGC 


AAATGGAGTG 


AAGTGCCATA 


AGTACAAACT 


TTCTTTTCAT 


TAAGAGACAA 


840 




CTCACAATTA 


TGTAAAAAGT 


GTGATTTATG 


CCCTACAGGA 


AGCCTTCAGA 


GTCTACCTCC 


900 




CTATCCCAGC 


ATCCCCGACT 


CCTTCCCCAM 


YTAATAAGGA 


CCCCCCTTCA 


ACCCAAATGG 


960 




TCCAAAAGGA 


GATAGACAAA 


AGGGTAAACA 


GTGAACCAAA 


GAGTGCCAAT 


ATTCCCCAAT 


1020 




TATGACCCCT 


CCCAAGCAGT 


GGGAGGAAGA 


GAATTCGGCC 


CAGCCAGAGT 


GCATGTGCYT 


1080 


20 


TTTYYTCTCC 


CAGACTTAAA 


GCAAATAAAA 


ACAGACTTAG 


GTAAATTCTC 


AGATAAYCCT 


1140 




GATGGCTATA 


TTGRTGTTTT 


ACAAGGGTTA 


GGACAATTCT 


TTGATCTGAC 


ATGGAGAGAT 


1200 




ATATATGTCA 


CTGCTAAATC 


AGACACTAAC 


CCCAAATGAG 


AGAAGTGCCA 


CCATAACTGC 


1260 




AGCCTGAGRG 


TTTGGCGATC 


TCTGGTATCT 


CAGTCAGGTC 


AATGGATANG 


GATGACAACA 


1320 




GAAGGAAAGA 


NAATGATTCC 


CCACAGGCCA 


GCARGCAGTT 


CCCAGTCTAS 


ACCCTCATTG 


1380 


25 


GGGACACAGA 


AATCAGTAAC 


ATGGGAGATT 


GGTGCTGCAG 


ACATTTGCTA 


ACTTGTGTGC 


1440 




TASAAGGACT 


AAGGAAAACT 


ASGAAGAAAR 


TCTAYGAATT 


ACTCAATGAT 


GTCCACCATA 


1500 




ACACAGGGGA 


AGGGAAGAAA 


ATCCTACTGC 


CTTTCTGGAG 


AGACTAAGGG 


AGGCATTGAG 


1560 




GAAGCGTGCC 


TCTCTGTCAC 


CTGACTCTTC 


TGAAGGCCAA 


CTAATCTTAA 


AGCGTAAGTT 


1620 




TATCACTCAG 


TCAGCTGCAG 


ACATTAGAAA 


AAACTTCAAA 


AGTCTGCCGT 


AGGCCCGGAG 


1680 


30 


CAAAACTTAG 


AAACCCTATT 


GAACTTGGCA 


ACYTCGGTTT 


TTTATAATAG 


AGATCAGGAG 


1740 




GAGCAGGCGG 


AACAGGACAA 


ACGGGATTAA 


AAAAAAGGCC 


ACCGCTTTAG 


TCATGACCCT 


1800 




CAGGCAAGTG 


GACTTTGGAG 


GCTCTGGAAA 


AGGGAAAAGC 


TGGGCAAATT 


GAATGCCTAA 


1860 




TAGGGCTTGC 


TTCCAGTGCG 


GTCTACAAGG 


ACACTTTAAA 


AAAGATTGTC 


CAAGTAGAAG 


1920 




TAAGCCGCCC 


CTTCGTCCAT 


GCCCCTTATT 


TCAAGGGAAT 


CACTGGAAGG 


CCCACTGCCC 


1980 


35 


CAGGGGACAA 


AGGTCTTTTG 


AGTCAGAAGC 


CACTAACCAG 


ATGATCCAGC 


AGCAGGACTG 


2040 




AGGGTGCCTG 


GGGCAAGCGC 


CATCCCATGC 


CATCACCCTC 


ACAGAGCCCT 


GGGTATGCTT 


2100 
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GACCATTGAG 


GGCCAGGAAG 


GTTGTCTCCT 


GGACACTGGT 


GCGGTCTTCT 


TAGTCTTACT 


2160 




CTTCTGTCCC 


GGACAACTGT 


CCTCCAGATC 


TGTCACTATT 


CTGAGGGGGT 


CCNTAAGACG 


2220 




GGCAGTCACT 


AGATACTTTY 


TCCCAGCCAC 


TAAGTTATGA 


ACTGGGGAGC 


TTTATTCTTT 


2280 




TCACATGCTT 


TTCTAATTAT 


GCTTGAAAGC 


CCCACTACCT 


TGTTAGGGAG 


AGACATTCTA 


2340 


5 


GCAAAAGCAG 


GGGCCATTAT 


ACACCTGAAC 


ATAGGAGAAG 


GAACACCCGT 


TTGTTGTNCC 


2400 




CCTGCTTGAG 


GAAGGAATTA 


ATCCTGAAGT 


CTGGGCAACA 


GAAGGACAAT 


ATGGACGAGC 


2460 




CAAAGAATGC 


CCGTCCTGTT 


CAAGTTAAAC 


TAAAGGATTC 


CACTTCCTTT 


CCCTACCAAA 


2520 




GGCAGTACCC 


CCTCAGACCC 


AAGGCCCAAC 


AAGGATTCCA 


AAAGATTGTT 


AAGGACTTAA 


2580 




AAGCCCAAGG 


CTTAGTAAAA 


CCATGCATAA 


CTCCCTGCAG 


TAATTCCGTA 


GTGGATTGAG 


2640 


10 


GAGGCACAGA 


AACCCAGTGG 


ACAGTGGAGG 


GTTAGTGCAA 


GATCTCAGGA 


TTATCAATGG 


2700 




AGGCCGTTGT 


CCTTTTATAC 


CCAGCTGTAC 


CTAGCCCTTA 


TACTGTGMYT 


TCCCAAATAC 


2760 




CAGAGGAAGC 


AGAGTGGTTT 


ACASTCCTGG 


ACCTTMAGGA 


TGCCTTCTTC 


TGCATCCCTG 


2820 




TACATCCTGA 


CTCTCAATTC 


TTGTTTGCCT 


TTGAAGATAC 


TTCAAACCCA 


RCATCTCAAC 


2880 




TCACCTGGAC 


TRTTTTACCC 


CAAGGGTTCA 


GGGATAGYCC 


CCATCTATTT 


GGCCAGGCAT 


2940 


15 


TAGCCCAAGA 


CTTGAGYCAR 


TYMTCATACC 


TGGACACTCT 


TGTCCTTCRG 


TAKGTGGATG 


3000 




ATTTACTTTT 


RGCYGCCYRT 


TCAG7VAACCT 


TGTGCCATCA 


AGCCACCCAA 


GCRCTCTTMA 


3060 




ATTTCCTCGC 


YACCTGTGGC 


TACAWGGTTT 


CCAAACSARA 


RGCTCARCTC 


TGCTCACAGC 


3120 




AGGTTAAATA 


CTTAGGRCTA 


ARATTATCCA 


AAGGCACCAR 


GGCCCTCAGT 


GAGGAAYRYA 


3180 




TCCAGCCTAT 


ACTGGCTTAT 


CCTCATCYCA 


AAACCCTAAA 


GCAACTAAGR 


GRRTTCCTTG 


3240 


20 


GCRTAAYAGG 


YTTCTGCCGA 


AWATGGATTC 


CCCAGGTWTG 


GCRAAATAGC 


CAGGYCATTA 


3300 




WATACASTAA 


TTAAGGAAAC 


TCAGAAAGCC 


AATACCCATT 


TARTAAGATG 


GAYAMCTGAA 


3360 




GYMRAAGTGG 


CTTTCCAGGC 


CCCTAAAGAA 


GGCCTTAAAC 


CCAAGYCCCA 


GTGTTAAGYT 


3420 




TGCCAACRGG 


GCAAGACTTT 


TSTTYATAYR 


TCACAGAAAA 


AAACAGRAAY 


AGCTCTRGGA 


3480 




GTCCTTACAC 


AGRTCCRAGG 


GAYGAGCTTG 


CAACCYRTGG 


CRYACCTGAS 


TAAGGAAAYT 


3540 


25 


GATGTAGTGG 


CAAAGGGTTG 


RCYTCATTGT 


TTAYGGGTAG 


TGGTGGCAGT 


AGCAGTYKTA 


3600 




GTATCTGAAG 


CAGTTAAAAT 


AATACAGGGR 


AGAGATCTTA 


CTGTGTGGAC 


ATCTCATGAK 


3660 




GTGAAYRGCA 


TACTCACTGC 


TAAAGGAGAC 


TTGTGGCTGT 


CAGACAACYG 


TTTACTTT^AA 


3720 




TRTCAGGCTC 


TATTACTTGA 


ARGGCCAGTG 


CTGCRACTGT 


GCACTTGTGC 


AACTCTTAAC 


3780 




CCAGYCNCAT 


TTCTTCCAGA 


CAATGAAGAA 


AAGATARAAY 


ATAACTGTCA 


ACAARTAATT 


3840 


30 


TCTCAAACCT 


ATGCCACTCG 


AGGGGACCTT 


YTAGARGTTC 


CYTTGACTGA 


TCCYGACCTT 


3900 




CAACTTGTAT 


ACTGATGGAA 


GTTCCTTTGT 


AGAAAAAGGA 


CTTCGAAAAG 


YGGGGTATGC 


3960 




AGTGGTCAGT 


GATAATGGAA 


TAYTTGAAAG 


TAATCCCCTC 


ACTCCAGGAA 


CTAGTGCTYA 


4020 




GCTRGCAGAA 


CTAATAGCCY 


TCAYTKGGGC 


ACTAGAATTA 


GGAGAAGRAA 


AAAGGGYAAA 


4080 




TATATATACA 


GACTCTRART 


ATGCTYACCT 


AGTCNTCCAT 


GCCCATGMRG 


CAATATGSAR 


4140 


35 


AGAAAGGGAA 


TTCCTAACTT 


CYGAGRGAAC 


ACCTATCAMA 


CATCAGGAAG 


CCATTAGGAR 


4200 




ATTATTAYTG 


GCWGTACAGA 


AACCTARAGA 


GGTGGMAGTC 


TTACACTGCY 


GGGGTCATCA 


4260 
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NAAAGGAAAG 


RAAAGGGAAA 


TASAAGRGAA 


YTGCCAAGCA 


KATATTGAAG 


CMAAAAGAGC 


4320 




TGCAAGGCAG 


GACCCTCCAT 


TAGAAATGCT 


TATTAAACTT 


CCCTTAGTAT 


AGGGTAATCC 


4380 




CTTCCGGGAA 


ACCAAGCCCC 


AGTACTCAGC 


AGGAGAAACA 


GAATGGGGAA 


CCTCACGAGG 


4440 




CAGTTTTCTC 


CCCTCGGGAC 


GGTTAGCCAC 


TGAAGAAGGG 


AAAATACTTT 


TGCCTGCAAC 


4500 


5 


TATCCAATGG 


AAATTACTTA 


AAACCCTTCA 


TCAAACCTTT 


CACTTAGGCA 


TCGATAGCAC 


4560 




CCATCARATG 


GCCAAATCAT 


TATTTACTGG 


ACCAGGCCTT 


TTCAAAACTA 


TCAAGCARAT 


4620 




AKTCAGGGCC 


TGTGAAKTGT 


GCCARARAAA 


TAATCCCCTG 


CCTYATCGCC 


AAGCTCCTTC 


4680 




AGGARAACAA 


ARAACAGGCC 


ATTACCCTGR 


ARAARACTGG 


CAACTGATTT 


TACCCACAAG 


4740 




CCCAAACCTC 


AGGGATTTCA 


GTATCTACTA 


GTCTGGGTAR 


ATACTTTCAC 


GGGTTGGGCA 


4800 


10 


FIAGGCCTTCC 


CCTGTAGGAC 


AGAAAAGGCC 


CAAGAGGTAA 


TAAAGGCACT 


AGTTCATGAA 


4860 




ATAATTCCCA 


GATTCGGACT 


TCCCCGAGGC 


TTACAGAGTG 


ACAATAGCCC 


TGCTTTCCAG 


4920 




GCCACAGTAA 


CCCAGGGAGT 


ATCCCAGGCG 


TTAGGTATAC 


GATATCACTT 


ACACTGCGCC 


4980 




TGAAGGCCAC 


AGTCCTCAGG 


GAAGGTCGAG 


AAAATGAATG 


AAAYACTCAA 


AGGACATCTA 


5040 




T^AAAAGCAAA 


CCCAGGAAAC 


CCACCTCACA 


TGGCCTGYTC 


TGTTGCCTAT 


AGCCTTAAAA 


5100 


15 


AGAATCTGCA 


ACTTTCCCCA 


AAAAGCAGGA 


CTTAGCCCAT 


ACGAAATGCT 


GTATGGAAGG 


5160 




CCCTTCATAA 


CCAATGACCT 


TGTGCTTGAC 


CCAAGACAGC 


CAACTTAGTT 


GCAGACATCA 


5220 




CCTCCTTAGC 


CAAATATCAA. 


CAAGTTCTTA 


AAACATTACA 


AGGAACCTAT 


CCCTGAGAAG 


5280 




AGGGAAAAGA 


ACTATTCCAC 


CCWWGTGACA 


TGGTATTAGT 


CAAGTCCCTT 


CYCTCTAATT 


5340 




CCCCATCCCT 


AGATACATCC 


TGGGAAGGAC 


CCTACCCAGT 


CATTTTATYT 


ACCCCAACTG 


5400 


20 


CGGTTAAAGT 


GGCTGGAGTG 


GAGTCTTGGA 


TACATCACAC 


TTGAGTCAAA 


TCCTGGATAC 


5460 




TGCCAAAGGA 


ACCTGAAAAT 


CCAGGAGACA 


ACGCTAGCTA 


TTCCTGTGAA 


CCTCTAGAGG 


5520 




ATTTGCGCCT 


GCTCTTCAAA 


CAACAACCAG 


GAGGAAAGTA 


ACTAAAATCA 


TAAATCCCCC 


5580 




ATGGSCCTCC 


CTTATCATAT 


TTTTCTCTKT 


ASTGTTSTTT 


YACCCTSTTT 


CACTCTCACT 


5640 




GCACCCCCTC 


CATGCCGCTG 


TATGACCAGT 


AGCTCCCCTY 


ACCMAGAGTT 


TCTATGGAGA 


5700 


25 


ATGCAGCGTC 


CCGGAAATAT 


TGATGCCCCA 


TCGTATAGGAG TCTTTSTAAG GGAACCCCC 


5760 




ACCTTCACTG 


CCCACACCCA 


TATGCCCCGC 


AACTGCTATC 


ACTCTGCCAC 


TCTTTGCATG 


5820 




CATGCAAATA 


CTCATTATTG 


GACAGGAAAA 


ATGATTAATC 


CTAGTTGTCC 


TGGAGGACTT 


5880 




GGAGTCACTG 


TCTGTTGGAC 


TTACTTCACC 


CAAACTGGTA 


TGTCTGATGG 


GGGTGGAGTT 


5940 




CAAGATCAGG 


CAAGAGAAAA 


ACATGTAAAA 


GAAGTAATCT 


CCCAACTCAC 


CSGGGTACAT 


6000 


30 


GGCACCTCTA 


GCCCCTACAA 


AGGACTAGAT 


CTCTCAAAAC 


TACATGAAAC 


CCTCCGTACC 


6060 




CATACTCGCC 


TGGTAAGCCT 


ATTTAATACC 


ACCCTCACTG 


GGCTCCATGA 


GGTCTCGGCC 


6120 




CAAAACCCTA 


CTAACTGTTG 


GATATGCCTC 


CCCCTGAACT 


TCARGCCATA 


TGTTTCAATC 


6180 




CCTGTACCTG 


AACAATGGAA 


CAACTTCAGC 


ACAGAAATAA 


ACACCACTTC 


CGTTTTAGTA 


6240 




GGACCTCTTG 


TTTCCAATST 


GGAAATAACC 


CATACCTCAA 


ACCTCACCTG 


TGTAAAATTT 


6300 


35 


AGCAATACTA 


CATACACAAC 


CAACTCCCAA 


TGCATCAGGT 


GGGTAACTCC 


TCCCACACAA 


6360 




ATAGTCTGCC 


TACCCTCAGG 


AATATTTTTT 


GTCTGTGGTA 


CCTCAGCCTA 


TCGTTGTTTG 


6420 



FEUILLE DE REMPLACEMENT (REGLE 26) 



TH!S PAGE BLAi^K (uspto; 



wo 99/02696 




PCT/FR98/01442 



28 



AATGGCTCTT 


CAGAATCTAT 


GTGCTTCCTC 


TCATTCTTAG 


TGCCCCCYAT 


GRCCATCTAC 


6480 


ACTGAACAAG 


ATTTATACAG 


TTATGTCATA 


TCTAAGCCCC 


GCAACAAAAG 


AGTACCCATT 


6540 


CTTCCTTTTG 


TTATAGGAGC 


AGGAGTGCTA 


GGTGCACTAG 


GTACTGGCAT 


TGGCGGTATC 


6600 


ACAACCTCTA 


CTCAGTTCTA 


CTACAAACTA 


TCTCAAGAAC 


TAAATGGGGA 


CATGGAACGG 


6660 


GTCGCCGACT 


CCCTGGTCAC 


CTTGCAAGAT 


CAACTTAACT 


CCCTAGCAGC 


AGTAGTCCTT 


6720 


CRAAATCGAA 


GAGCTTTAGA 


CTYGCTAACC 


GCTGARAGAG 


GGGGAACCTG 


TTTATTTTTA 


6780 


GGGGAAGAAT 


GCTGTTATTA 


TGTTAATCAA 


TCCGGAATCG 


TCACTGAGAA 


AGTTRAAGAA 


6840 


ATTCSAGATC 


GAATACAACG 


TAKAGCAGAR 


GAGCTTCGAA 


ACACTGGACC 


CTGGGGCCTC 


6900 


CTCAGCCRAT 


GGATGCCCTG 


GATTCTCCCC 


TTCTTAGGAC 


CTCTAGCAGC 


TATAATATTG 


6960 


CTACTCCTCT 


TTGGACCCTG 


TATCTTTRAC 


CTCCTTGTTA 


ACTTTGTCTC 


TTCCAGAATC 


7020 


GAAGCTGTRA 


AACTACAAAT 


GGAGCCCAAG 


ATGCAGTCCA 


AGACTAAGAT 


CTACCGCAGA 


7080 


CCCCTGGACC 


GGCCTGYTAG 


CCCACGATCT 


GATGTTAATG 


ACATCAAAGG 


CACCCCTCCT 


7140 


GAGGAAATCT 


CAGCTGCACA 


ACCTCTACTA 


CGCCCCAATT 


CAGCAGGAAG 


CAGTTAGAGC 


7200 


GGTSGTCGGC 


CAACCTCCCC 


AACAGCACTT 


AGGTTTTCCT 


GTTGAGATGG 


GGGACTGAGA 


7260 


GACAGGACTA 


GCTGGATTTC 


CTAGGCTGAY 


TAAGAATCCY 


TAAGCCTAGS 


TGGGAAGGTG 


7320 


ACCACATCCA 


CCTTTAAACA 


CGGGGCTTGC 


AACTTAGYTC 


ACACCTGACC 


AATCAGAGAG 


7380 


CTCACTAAAA 


TGCTAATTAG 


GCAAAGACAG 


GAGGTAAAGA 


AATAGCCAAT 


CATYTATTGC 


7440 


MTGAGAGCAC 


AGCAGGAGGG 


ACAATGATCG 


GGATATAAAC 


CCAAGTYTTC 


GAGCCGGCAA 


7500 


CGGCAACCCC 


CTTTGGGTCC 


CCTCCCTTTG 


TATGGGAGCT 


CTGTTTTCAT 


GCTATTTCAC 


7560 


TCTATTAAAT 


CTTGCARCTG 


CR 








7582 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

25 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2563 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

30 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
35 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
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ACTGCACTCT TCTGGTCCAT GTTTGTTACG GCTCGAGCTG AGCTTTTGCT CGCCATCCAC 60 

CACTGCTGTT TGCCACCGTT GCAGACCCAC TGCTGACTTC CATCCCTCTG GATCTGGCAG 120 

5 GGTGTCTGCT GTGCTCCTGA TCCAGCGAGG GG CCCATTGC CACTCCCAAT CGGGCTAAAG 180 

GCTTGCCATT GTTCCTGCAT GGCTAAGTGC CCAGGTTCAT CCTAATTGAG CTGAACACTA 240 

GTCACTGGGT TCCACAGTTC TCTTCCATGA ACCACGGCTT TTAATAGAGC TATAACACTC 300 

10 

ATCGCAAGGC CCAAGATTCC ATTCCTTGGA ATCTGTGAGG CCAAGAACCC TAGGTCAGAG 360 

AACACGAGGC TTGCCACCAT CTTGGAAGCA GCCTGCCACC ATCTGGGAAG CGGCCTGCCA 420 

15 CCATCTTGGA AGCCGCCCGC CACCATCTTG GGAGCTCTGG GAGCAAGGAC CTCCCCGCAA 480 

CCCAGTAACA TTTAGCGACC ACGAAGGGAC CTCCAAAGCG GTAATATTGG ACCACTTTCA 540 

CTTGCTATTC TGTCCTATCC TTCCTTAGAA TTGGAGGAAA ATACCGGACA CCTGTCGGCC 600 

20 

GGTTAAAAAC GATTAGCGTG GCCTCCGGAC TTAAGAATCA GGTGTGAGGC TATCTGGGGA 660 

AGGGCTTTCT AACAACCCCC AACCRTTCTG GGTTGGGAAT GTTGGTCTGC CTGGAGCCAG 720 

25 CTTCCACTTT CAATTTTCCT GGGGAAGCCA AGGGCCGACT AGAGGCAGAA AGCTGTTGTC 780 

CCAAATTCCC GGCAGTAGCC GGTTGAGATC ATGGCGCAGC CAGAAGTCTT TACTCCACAG 840 

TCACCCATGC ATGCGCCCCT ATCTTTCCTT CTGACCCATA CCTCCTGGGT CCTAACCATG 900 

30 

ACTTTCTTAA AAGGGTAGCC CCAAAATTCT CCTTACCTCT GAATCTACTT CCTCTGATCC 960 

CTGCCTCCTA GGTGCTAATG GTTCAGACTT TCATTTCCTC TAGCAAGTTG TATYTCCAAA 1020 

35 GGGATATAAG GAAGCTCTAC ACTGTATCCT TAGGCATCTA GGCTCTAAAC CCAGGGAGTC 1080 
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TTGTCCCTGA TGTCCCAACC GATTTAGGTA 
ACCCATTCCC CACCACCCTT GCCAGGGCCC 
5 GAGAGAGAGA GAGACAGAGT GAGACACAGA 
GGAGAGAGAC ACAGAGAGGG GAGAGACACA 
GGAGTCYMAG AGAGAGAGAA AGAAGAAGAA 

10 

TTAAAAGCCA GGGTAAATTT AAAAAACCTA 
CCTGTAACAC TCTAATACTA CCTTGTTCTC 
15 CTGAGACCGC TGACACCCAT AGCTTTCCTA 
TGGCCCGCAT GCATTCAATC TGTAGTGGCA 
AGTAACTTTT AGAGGAAACC TCATTGTGAG 

20 

TCAAAAAAGC AAAAAGGTAG CTTACTAACT 
TAGAAAAAGG TAATTTAACA CTAATCACTG 
25 CAGGAGATTT AAATCTTAAT TACCATACAA 
TCAGTACAGG ATGATAGATG GTTCCTCCCA 
TCAGTAATTG ATAGGGAGAC TCTTGTGGAA 

30 

TCTCCCCAAA CCTGCGAGCT GTTTGCACTC 
AAAGATTATC TCAATCCTGA CTCAAAAGGT 
35 TAAGAACTGT TTATGGGACT GCATCTTGAT 
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TATAGTTCTC GACATGGGCA GTTATGTGGG 1140 

CAAGTTTGTA AATGGCTAAG AGAGGAAAGT 1200 

GAGAGGGAGA GAGAGAGAGA GAGAGAGAGA 12 60 

GAGAGGAGAA GGGGGCAGAG AGACCAAGAG 1320 

ATAGTAGAAA AAAAAGTGTG CCCTATTCCT 1380 

TACTTGATAA TTGAAGGTCT TCTCCATGAC 1440 

AGTGTAAACA AGGGTGTTAG CCTGAAAACA 1500 

TAAAAAATCC TTAACCCAGT T^CCCGCAGA 1560 

ACTGCTTTGC TAACAAGAAT AAAGTGGAAA 1620 

CACACCTCAC CAGTTCAGAA TTATTCTAAG 1680 

CAAAAATCTT AAAGTATGGG GTTATTTTGT 1740 

ATAATTCCCT TAACCCAGAA GATTTCCTAA 1800 

AGGTCTGACC AGACCTAGGA GGAACTCCCT 1860 

GGTGAATGAA AAAAAAATCA CAATGGGTAT 1920 

GCAGAGTTAG AAAAACTGCC TAATAATTGG 1980 

AGCCAAGCCT TAAAGTACTT CTAGAATCAA 2040 

TACCTACACC CTCTGTGAAA CGAATTTACT 2100 

GGGGCAGCTG GGTTGTCATG AAATACTCAG 2160 
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GAATGCAGCC TAGCTCTAGG ACTCACCCCT GAGCACAAAG GCAATGTTGG GCATGCTGGT 2220 

AAAGGACCAC TAGAATCCAG CAGTCCGAAC CCTTTCTTTG GGTTAAGAAA GGCGGGAAAA 2280 

5 CAGGCGCAGG ACTGCTACAT TGGTAAGCGT AACTAATCCA ATAAGCAGAG GTCCATGGGT 2340 

GGTGACACAC TCTGGAAAGG AATAAGCATT AGRACCATAG AGGACGCTCT ACGACTAATG 2400 

CTCGTCGGAA AATGACTAGA GGTGCTGGCA TCCCTATGTT CTTTTTTCAG ATGGGAAATG 2 460 

10 

TTCCCCCTCA AGGCAAA7VAC ACCCCTAAGA TGTATTCTGG ACAATTGGGA CCAATTTGAC 2 520 

CCTCAGACTC TAAGAAAGAA ACGACTTATA TTCTTCTGCA GTG 2 563 

15 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2585 paires de bases 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



25 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
3 0 TCAGGGATAG CCCCCATCTA TTTGGCCAGG TATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 
ACTTGGACAC TCTTGTCCTT TGGTATGTGG ATGATCTACT TTTAGCCACC TGTTCAGAAA 120 
CCTTGTGCCA TCAAGCCAAC CAAGTGCTCT TAAACTTCCT CGCCACCTGT GGCTACAAGG 180 

35 

TTTCCAAACC AGAGGCTCAG CTCTGCTTAC AGCAGGTTAA ATACTTAGGG CTAAAATTAT 240 
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CCAAAGGCAC CAGGGCCCTC AGTGAGGAAC GTATCCAGCC TATACTGGCT TATCCTCATC 300 
CCAAAACCCT GAAGCAATTA AGAGGGTTCC TTGGCATAAA AGGCTGCTGT TGAATATGGA 360 



TTCCCAGGTA CAATGAAATA GCCAGGCCAT TATACACACT AATTACGGGA ACTCAGAAAG 420 

CCAATACCCA TTTAGTAGAA TGGACACCTG AAGCAGAAGC GGCTTTCCAG GCCCTAAAGA 480 

10 AGGCCCTAAT CCAAGCCCCA GTGTTAAGCT TGCCAATGGA GCAAGACTTT TCTTTATATG 540 

TCACAGAAAA AAAAACAGGA ATAGCTCTAG AAGTCCTTAC ACAGGTCCGA GGGACCAGCT 600 

TACAACACAT GGCATACCTG AGTAAGGAAA CTGATGTAGT GGCAAAGGGT TGGACTCATT 660 

15 

GTTTACAGGT AGTGGCAGCA GTAGCAGTCT TAGCATCTGA AGCAGTTAAA ATGATACAGG 720 

GAAGANATCT TACTGTGTGG ACATCTCATG ATGTGAACGG CATACTCACT GCTAAAGGAG 780 

2 0 ACTGTGGCTG TCAGACAACC ATTTGCTTAA ATATCAGGCT CTATCACTTG AANGGCCAGT 840 

GCTGCCACTG TGCACTTGTG CAACTCTTAA CCCACCCACA TTTCTTCCAG ACAATGAAGA 900 

AAAGATAGAA CATAACTGTC AACAAGTGAT TGTTCAAACC TACACCGCTC GAAGGGACCT 960 

25 

TCTAGAGGTT CCCTTGACTG ATCCTGAGCT CAACTTCTAT ACTGATGGAA GTTCCTTTTG 1020 

TAGAAAAAGG ACTTCGAAAG GCGGGTATGC AGTGGCCAGT GATAATGGAA TACTTGAAAG 1080 

3 0 TAATCCCTTC ACTCCAGAAA CTAGCATTCA GCTGGCAGAA TTAATAGCCT TCACTTGGGC 1140 

ATTAGAACAC AGGAGAAGGA AAAGGAGTAA ATATATATAC AGACTCCAAG TATGCTTACT 1200 

TAGTCCTCCA TGCCCATGCA GCAATATAGA GAGAAAGCGA ATTCCTAACT TCTGAGGGAA 12 60 

35 

CACCTATCAA ACATCAGGAA GCCATTAGGA GATTATTACT GGCTGTACAG AAACCTAGAG 1320 



5 
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GTGGCAGTCT TACATGGCCG AGATCATCAG AAAGGAAAAG AAAGGGAAAT AGAAGGGAAC 1380 

TGCCAAGTGG ATATTGAAGC C7VAAAGAGCT GCAAGGCGGG ACCCTCCATT AGAAATGCTT 1440 

5 

ATAGAAGGAC CCCTAGTACA GGGCAATCCC CTTCAGGAAA CC7VAGCCCCA ATACTCAGCA 1500 

GAAGAAATGG AATGGGGAAC CTCATGAGGA CATAGTTTCC TCCCCTCAGG ATGGCTAGCC 15 60 

10 ACCAAAGAAG GAAAAATACT TTTGCCTGCA GCTAACCAAT GGAAATTACT TAAAACCCTT 1620 

CACCAAACCT TTCGCTTAGG CATTGATAGC ACCCATCAGA TGGCTAAATC ATTATTTACT 1680 

AGACCACACC TTTTCAAAAC TATCAAGCAG ACAGTTAGGG CCTGTGAAGT GTGCCAAAGA 1740 

15 

AATAATCCCC TGCCTTATCG CCAAACTCCT TCAGGAGAAA AAAGAACAGG CCATTACCCA 1800 

GGAGAAGAGT GGCAACTAGA TTTTACCCAC ATGCCCAAAT CTCAGGGATT TCAGTATCTA 1860 

2 0 CTAGTCTGGG TAGATACTTT CACTGGTTGG GCGGAGGCCT TCCCTTGTAG GACAGAACAG 1920 

GCCCATGAGG TAATAAAGGC ACTAATTCAT GAAATAATTC CCAGATTTGG ATTTCCCCAA 1980 

GGCTTACAGA GTGATAACGG CCCCACTTTC AAGGCTACAG TAACCCAGGG AGTATCCCAG 2040 

25 

ACATTAGACA TACAATATCA CTTACACTGA GCCCGGAGGC CACAATCCTC AGGAAAGTTG 2100 

AGAAAATGAA TGAAACGCTC AAATGACATC TAAAAAAGCT AACCTAAGAA ACCCACCTCT 2160 

3 0 CATGGTTTGC TCTGTTGCCT ATAGCCTTAG TAAGAATCCG AAACTCTCCC CAAAAAGCGG 2220 

GACTCAGCCC ATACGAAATG CTGTATGGAC GGCCCTTCCT AACCAATGAC CTTGTGCTTG 2280 

ACCTAGAGAT GGCCAACTTA GTTGCAGATA TCCCTCCTTA GCCAAATATC AACAAGTTCT 2340 

35 

TAAAACGTCA CAGGGAACCT GTCCCTGAGA GGAGGGAAAG GAATTATTCC AACCTGGTGA 2400 
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CATGGTATTA GTGAAGTCCC TTCCCTCCAA CTCCCCATCC CCTGGATACA TCCTGGGAAG 2460 
GACCCTACTC AGTCATTTTA TCTATCCCAA CCGCGGTTAA AATGGCTGGA GTAGAATCTT 2520 

5 

GGATACATCA CATTCGAGTC AAACCCTAGA TACTGCCACA AGGAACCTGA AAATCCAGGA 2 580 
GACAA 2 585 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2575 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN 



20 



(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO; 14: 

25 GGGATAGCCC CCATCTATTT GGCCAGGCAT TAGCCCAAGA CTTGAAGCCA ATTCTCATAC 60 

CTGGACACTC TTCTCCTTTG GTATGTGGAT GATTTACTTT TAGCTTCCTG TTCAGAAACC 120 

TTGTGCCATC AAGCCACCCA AGCACTCTTA AATTTCCTCG CTACCTGTGG CTACAAGGTT 180 

30 

TCCAAACCAA AGACCCAGCT CTGCTCACAG CAGGTTAAAT ACTTGGGGCT AAAATTATCC 240 

AAAGGCACCA GGGCCCTCAG TGAGGAACGT ATCAAGCCTA TACTGGCTTA TCCTCATCCC 300 

3 5 CAAATCCTAA AGCAACTAAG AGAGTTCCTT AGCATAACAG GTTTCTGCTG AATATGGATT 360 
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CCCAGGTATG GCAAAATAGC CAGACCATTA 
AATACCCATT TAGTAAGATG GATACCTGAA 
5 GCCCTAACCC AAGCCCCAGT GTTAAGCTTG 
ACAGAAAAAA CAGGAAATAG CTCTAGGAGT 
ACCCATGGCA TACCTGAGTA AGGAAATTGA 

10 

ATGGGTAGTG GCGGCAGTAG CAGTCTTAGC 
AGATCTTACT GTGTGGACAT CTCATGATGT 
15 GTGGCTGTCA GACAACCATT TACTTAAATA 
GCAACTGCGC AGTTGTGCAG CTCTTAACCC 
AACATAACTG CCAACAAGTA ATTTCTCAAA 

20 

TTCCCTT7VAC TGATCCCGAC CTCAACTTGT 
GACTTTGAAA AGTGGGGTAT GCAGTGCTCA 
25 TCATTCCAGG AACCAGCGTT CAGCTGGCAG 
TAGGAGAAGG AAAAAGGGTA AATACACATA 
GTGCCCACGC AGCAATATGG AGAGAAAGGG 

30 

AACATCAGGA AGTTATTAGG AGATTATTAT 
TCTTACACTG CTGGGGTGGT CAGAAAGAAA 
35 CGGATATTGA AGCCAAAAGA GCCGCAAGGC 
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35 

TATACGCTAA TTAAGGAAAC TCAGAAAGCC 420 
GCAGAAGCAG CTTTCCAGGC CCTAAAGAGG 480 
CCAACAGGGC AAGACTTTAC TTCGTATGTC 540 
CCTTACACAA GTCTGAGGGA TGAGCTTGCA 600 
TGTAGTGGCA AAGGGTTGGC CTCATTGTTT 660 
ATCTGAAGCA GTTAAAATGA TACAGGGAAG 720 
GAATGGCATA CTCACTGCTA AAGGAGACTT 780 
TCAGGCTGTA TTACTTGAAG GGCCAGTGCA 840 
AGCCACATTT CTTCCAGACA ATGAAGATAG 900 
CCTAGGCCGC TCGAGGGAAC CTTTTAGAGG 960 
ATACTGATGG AAGTTCCTTT GTAGAAAi^G 1020 
GTGATAATGG AATACTTGAA AATAATCCCT 1080 
AATTAATAGC CCTCACTCGG GCATTAGAAT 1140 
CAGATTCTAA GTATGTTTAC TTAGTCCTCC 1200 
AATGCTTAAC TTCTGAGGGA ACACCTATCA 1260 
TGGCTATACA GAAACCTAAA GAGGTGGCAG 1320 
AGGAAAGGGA AATAAAAGGG AACTGCCAAG 1380 
AGGACCCTCC ATTAGAAATG CTTATAGAAG 1440 



FEUILLE DE REMPLACEMENT (REGLE 26) 



THIS PAOE BLAI^K (usfto) 



.^iaSPAOE BLAiSC (USPTO) 



wo 99/02696 




GACCCCTAGT ATGGGGTAAT CCCCTCCGGG 
TAGAATGGGG AACCTCACGA GGACATAGTT 
5 AAGGAAAAAT ACTTTTGCCT GCAGCTAACC 
CCTTTCACTT AGACATTGAT AGCACCCATC 
GCCTTTTCAA AACTATCAAG CAGCTAGTCA 

10 

CCATGCCTTA TCACCAAGCT CCTTCAGGAG 
RVTGGCAACT AGATTTTACC CACATGCCCA 
15 GGGTAGATAC TTTCACTGGT TGGGCAGAGA 
AGGTAATAAA GGCATTAGTT CATGAAATAA 
AGAGTGACAA TGGCCCTGCT TTCAAGGCTA 

20 

TATACAATAT CACTTACACT GCGCCTGGAG 
TGAAACACTC AAACGACATC TAAAAAAAGC 
2 5 CTCTGTTGCC TATAGCCTTA CTAAGAATCC 
CATACGAAAT GCTATATGGA TAGCCCTTCC 
GAGCCAACTT AGTTGCAGAC ATCACCTCCT 

30 

TACAAGGAGC CTGTCCCCGA GAAGAGGGGA 
TAGTCAAGTC CCTTCCCTCT AATTCTCATT 
35 CAGTCATTTT ATCTACCCCA ACCGCAGTAA 
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AAACCAAGCC CCAATACTTA GAAAAAGAAA 1500 

TCCTCCCCTC AGGATGGCTA GCCACCGAAG 1560 

AATGGAAATT ACTTAAAACC CTTCACCAAA 1620 

AGATGGCCAA ATCATTATTT ACTGGACCAG 1680 

GGGCCTGTGA AGTGTGCCGA AGAAATAATC 1740 

AACAAAGAAC AGGCCATTAC CCAGGAGAAG 1800 

AATCTCAGGG ATTTCAGTAT CTACTAGTTT 1860 

CCTTCCCCTG TAAGACAGAA AAGTCCCAAG 192 0 

TTCCCAGATT CAGACTTCCC TGAGGCTTAC 1980 

CAGTAACCCA GGAGTATCCC AGGTGTTAGG 2040 

GCAGTCCTCA GGGAAGGCCG AGAAACTGAA 2100 

TAACCCAGGA AAACCACCTC ACATGGCCTG 2160 

AAAACTCTCC CCAAAAAGCA GGACTTAGCC 2220 

TAACCAATGA CCTTGTGCTT GACTGAGAGA 2280 

TATCCAAATA TCAACAAGTT CTTAAAACAT 2340 

AGGAACTATT CCACCCTGGT GACATGGTAT 2400 

GCCTAGATAT ATCCTGGGAA GGACCCTACC 2460 

AAGTGGCTGG AGTGGAGTCT TGGATACATC 2520 
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ACACTCGAGT CAAACCCTGG ATATTACCAA AGGAACCTGA AAATCCAGGA GACAA 2 57 5 



(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

5 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 783 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
10 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 



15 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 





TGAGAGACAG 


GACTAGCTGG 


ATTTCCTAGG 


CYGACTAAGA 


ATCCYTAAGC 


CTAGSTGGGA 


60 




AGGTGACCAC 


RTCCACCTTT 


AAACACGGGG 


CTTGCAACTT 


AGYTCACACC 


TGACCAATCA 


120 


20 


GAGAGCTCAC 


TAAAATGCTA 


ATTAGGCAAA 


GACAGGAGGT 


AAAGAAATAG 


CCAATCATYT 


180 




ATTGCMTGAG 


AGCACAGCAG 


GAGGGACAAY 


RATCGGGATA 


TAAACCCARG 


YHTTCGAGCY 


240 




GGCAACRGCA 


GMCCCCCTTT 


GGGTCCCYTC 


CCTTTGTATG 


GGAGCTCTGT 


TTTCATGCTA 


300 




TTTCACTCTA 


TTAAATCTTG 


CARCTGCRCT 


CTTCTGGTCC 


ATGTTTCTTA 


CGGCTYGAGC 


360 




TGAGCTTTYG 


CTCRCCRTCC 


ACCACTGCTG 


TTTGCCRCCA 


CCGCANACCY 


GCCGCTGACT 


420 


25 


CCCATCCCTC 


TGGATCMTGC 


AGGGTGTCCG 


CTGTGCTCCT 


GATCCAGCGA 


RGCRCCCATT 


480 




GCCGCTCCCA 


ATYGGGCTAA 


AGGCTTGCCA 


TTGTNCCTGC 


AYGGCTAAGT 


GCCTGGGTTY 


540 




RTYCTAATTG 


AGCTGAACAC 


TANTCACTGG 


GTTCCATGGT 


TCTCTTCTGT 


GACCCACRGC 


600 




TTCTAATAGA 


RCTATAACAC 


TYACCRCATG 


GCCCT^GRTT 


CCATTCCTTG 


GAATCCRTRA 


660 




RGSCAACGAA 


CYCCASGTCA 


GAGAAYACGA 


RGCTTGCCAC 


CATCTTGGAA 


GCGGCCTGCT 


720 


30 


ACCATCTTGG 
ACA 


AAGTGGTTCA 


CCACCATCTT 


GGGAGCTCTG 


TGAGCAAGGA 


CCCCCMRGTR 


780 
783 



(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

35 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 20 paires de bases 
<B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

5 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
10 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

TGTCCGCTGT GCTCCTGATC 2 0 

15 (2) INFORMATIONS POUR LA SEQ ID NO: 17: 

{i> CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

20 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

25 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

ATGCACTCTG GCTGGGCCAA T 21 

30 

(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
35 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

FEUILLE DE REMPLACEMENT (REGLE 26) 



iri 



wo 99/02696 




PCT/FR98/01442 



39 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 
ACCATTTGAC CCTCAGACAC T 21 



(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 
AACCCTTTGC CACTACATCA ATTT 24 



(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 

5 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 
TCAGGGATAG CCCCCATCTA T 21 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 22 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



20 



(ii) TYPE DE MOLECULE: ADN 



(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
25 TTGTCTCCTG GATTTTCAGG TT 22 

(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

3 0 <i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

35 

(ii) TYPE DE MOLECULE: ADN 
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(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 

5 

GGACCCTACC CAGTCATTTT 20 
(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

10 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

20 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
ATCAGGAGCA CAGCGGACAC 20 

25 

(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 22 paires de bases 
30 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



35 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GGACATCCAA AGTGATACAT CC 2 2 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
10 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

15 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 



20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 



AATGTATGGC CTGAAGTGCA G 21 



(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

25 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
30 (D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: ADN 



35 



(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
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CTTCCCAGGA TGTATCACTT TG 22 

5 (2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

10 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 

CACTGCAGAA GAATATAAGT CGTT 24 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 0 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
35 GCTTCCAAGA TGGTGGCAAG C 21 
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(2) INFORMATIONS POUR LA SEQ ID NO: 29: 



(i) CAFtACTERISTIQUES DE LA SEQUENCE: 



5 



(A) LONGUEUR: 678 paires de bases 



(B) TYPE: nucleotide 



(C) NOMBRE DE BRINS : simple 



(D) CONFIGURATION: lineaire 



10 



(ii) TYPE DE MOLECULE: ADN 



(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 



NO: 29: 



15 



TCAGGGATAG CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 

ACCTGGATAT TCTTGTCCTT TGGTATGCGG ATGATTTACT TTTAGCCGCC CGTTCAGAAA 120 

2 0 CCTTGTGCCA TCAAGCCACC CAAGTGCTCT TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 

TTTCCAAACC AAAGGCTCAG CTCTGCTCAC AGCAGAAGGC TATTTACCCT AAATACTTAG 240 

GGCTGAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ATGTATCCAG CCTATACTGG 300 

25 

CTTATCCTTA TCCCAAAACC CTAAAACAAC TAAGAAGGTT CCTTGGCATA ATAGGCATAA 360 

CAGGCATAAC AGGTTTCTGC TGAATATGGA TTCCCAAGTA CGGCAAAATA GCCAGACCAT 420 

3 0 TATATACACT AATTAAGGAA ACTCAGAAAG CCAATACCCA TTTAGTAAGA TGGACACCTG 480 



AAGCAGAGGC AGCTTTCCAG GCCGTAAAGA ACACCCTAAC CCAAGCCCCA GTGTTAAGCT 540 



TGCCAGCGGG GCAAGACTTT TCTTTCTGTG TCACAGAAAA AATAGGAATA GCTNTAGGAG 600 

35 

TCCTTACACA GGTCCGAGGG ACCAGCTTGC AACCCATGGC ATACCTGAGT AAGGAAATTG 660 
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ATGTAGTGGC AAAGGGTT 678 

5 (2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 536 paires de bases 

(B) TYPE: nucleotide 

10 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 

CCAATCTCCA TGTTGTATCC CCTTCCCCAA CTAATAAGGA CCCCCCTTTC AACCCAAACA 60 

20 

GTCCAAAAGG ACATAGACAA AGGAGTAAAC AATGAACCAA AGAGTGCCAA TATTCCCTGG 120 

TTATGCACCC TCCAAGCGGT GGGAGAAGAA TTCGGCCCAG CCAGAGTGCA TGTACCTTTT 180 

25 TCTCTCTCAC ACTTGAAGCA AATTAAAATA GACCTAGGTA AATTCTCAGA TAGCCCTGAT 240 

GGCTATATTG ATGTTTTACA AGGATTAGGA CAATCCTTTG ATCTGACATG GAGAGATATA 300 



ATATTACTGC TAAATCAGAC GCTAACCTCA AATGAGAGAA GTGCTGCCAT AACTGGAGCC 360 

30 

CGAGAGTTTG GCAATCTCTG GTATCTCAGT CAGGTCAATG ATAGGATGAC AACGGAGGAA 420 



AGAGAACGAT TCCCCACAGG GCAGCAGGCA GTTCCCAGTG TAGCTCCTCA TTGGGACACA 480 



35 GAATCAGAAC ATGGAGATTG GTGCCGCAGA CATTTAAAGC TTTCCCCGGG TACCGA 536 
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(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 591 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 

15 

CCATGGCCAT CTACACTGAA CAAGATTTAT ACAATCATGT CGTACCTAAG CCCCACAACA 60 
AAAGAGTACC CATTCTTCCT TTTGTTATCA GAGCAGGAGT GCTAGGCAGA CTAGGTACTG 120 

2 0 GCATTGGCAG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAAATAAATG 180 

GTGACATGGA ACAGGTCACT GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 240 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTTGCT AACCGCCAAA AGAGGGGGAA 300 

25 

CCTGTTTATT TTTAGGAGAA GAACGCTGTT ATTATGTTAA TCAATCCAGA ATTGTCACTG 360 
AGAAAGTTAA AGAAATTCGA GATCGAATAC AATGTAGAGC AGAGGAGCTT CAAAACACCG 420 

3 0 AACGCTGGGG CCTCCTCAGC CAATGGATGC CCTGGGTTCT CCCCTTCTTA GGACCTCTAG 480 

CAGCTCTAAT ATTGTTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAAGTTTG 540 
TCTCTTCCAG AATTGAAGCT GTAAAGCTAC AGATGGTCTT ACAAATCTAG A 591 

35 
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(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 364 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
15 CTAACCTGAG GATCCAGCAG CAGGACTGAG GGTGCCCGGG GCAAGTGCCA GCCCATGCCA 60 
TCACCCTCAG AGCCCCGGGT ATGTTTGACC ATTGAGAGCC AGGAAGTTAA CTGTCTCCTG 120 
GACACTGGCG CAGCCTTCTC AGTCTTACTT TCCTGTCCCA GACAATTGTC CTCCAGATCT 180 

20 

GTCACTATCC GAGGGGTCCT AGGACAGCCA GTCACTACAT ACTTCTCTCA GCCACTAAGT 240 
TGTGACTGGG GAACTTTACT CTTTTCACAT GCTTTTCTAA TTATGCCTGA AAGCCCCACT 300 
25 CCCTTGTTAG GGAGAGACAT TTTAGCAAAA GCAGGGGCCA TTATACACCT GAACAAGCTT 360 
GAAA 364 



3 0 (2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 538 acides amines 

(B) TYPE: acide amine 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



FEUILLE DE REMPLACEMENT (REGLE 26) 



5 



10 



WO 99/02696 1^ PCT/FR98/01442 



48 



(ii) TYPE DE MOLECULE: proteine 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

Met Gly Leu Pro Tyr His lie Phe Leu Cys Ser Val Leu Ser Pro Cys 
15 10 15 

Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser Ser Ser 
20 25 30 



Pro His Pro Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn lie Asp 
15 35 40 45 

Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe Thr Ala 
50 55 60 

20 His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu Cys Met 

65 70 75 80 

His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro Ser Cys 
85 90 95 

25 

Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr Gin Thr 
100 105 110 

Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu Lys His 
30 115 120 125 

Val Lys Glu Val lie Ser Gin Leu Thr Gly Val His Gly Thr Ser Ser 
130 135 140 

35 Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu Arg Thr 

145 150 155 160 
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His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly Leu His 
165 170 175 

Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu Pro Leu 
180 185 190 

Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp Asn Asn 
195 200 205 

Phe Ser Thr Glu He Asn Thr Thr Ser Val Leu Val Gly Pro Leu Val 
210 215 220 



Ser Asn Val Glu He Thr His Thr Ser Asn Leu Thr Cys Val Lys Phe 
15 225 230 235 240 

Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Trp Val Thr 
245 250 255 

20 Pro Pro Thr Gin He Val Cys Leu Pro Ser Gly He Phe Phe Val Cys 

260 265 270 

Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser Met Cys 
275 280 285 

25 

Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu Gin Asp 
290 295 300 

Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val Pro He 
30 305 310 315 320 

Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly Thr Gly 
325 330 335 

35 He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu Ser Gin 

340 345 350 
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Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
355 360 365 . 

Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Arg Asn Arg Arg 
370 375 380 

Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu Phe Leu 
385 390 395 400 

Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly lie Val Thr Glu 
405 410 415 



Lys Val Glu Glu lie Pro Asp Arg lie Gin Arg lie Ala Glu Glu Leu 
15 420 425 430 

Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Arg Trp Met Pro Trp lie 
435 440 445 

20 Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Leu Leu Leu Leu Phe 

450 455 460 

Gly Pro Cys lie Phe Asp Leu Leu Val Asn Phe Val Ser Ser Arg lie 
465 470 475 480 

25 

Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys Thr Lys 
485 490 495 

lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser Asp Val 
30 500 505 510 

Asn Asp lie Lys Gly Thr Pro Pro Glu Glu lie Ser Ala Ala Gin Pro 
515 520 525 

35 Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 

530 535 
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(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 52 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



10 



(ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE: NON 

15 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 

Met Glu Pro Lys Met Gin Ser Lys Thr Lys lie Tyr Arg Arg Pro Leu 
15 10 15 

2 0 Asp Arg Pro Ala Ser Pro Arg Ser Asp Val Asn Asp lie Lys Gly Thr 

20 25 30 

Pro Pro Glu Glu lie Ser Ala Ala Gin Pro Leu Leu Arg Pro Asn Ser 
35 40 45 



25 



Ala Gly Ser Ser 
50 



3 0 (2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 48 acides amines 

(B) TYPE: acide amine 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: peptide 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 

Met Leu Met Thr Ser Lys Ala Pro Leu Leu Arg Lys Ser Gin Leu His 
15 10 15 

Asn Leu Tyr Tyr Ala Pro He Gin Gin Glu Ala Val Arg Ala Val Val 
20 25 30 

Gly Gin Pro Pro Gin Gin His Leu Gly Phe Pro Val Glu Met Gly Asp 
35 40 45 
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iniemaiionai /vppHcaiion ino. 


REQUEST 


International Filing Date 


The undersigned requests that the present 

international application be processed 
according to the Patent Cooperation Treaty. 


Name of receiving Office and "PCT International Application" 




Applicant's or agent's file reference 

(if desired) (12 characters maximum) MD/B05B2754 


Box No. I TITLE OF INVENTION 

Endogenetic retroviral sequences, associated with autoimmune diseases or with pregnancy disorders 


Box No. II APPLICANT 


Name and address: (Family name followed by given name; for a legal entity, full official 
designation. The address must include postal code and name of country. The country of the address 
indicated in this Box is the applicant's State (that is, country) of residence if no State of residence is 
indicated below.) 

BIO MERIEUX 
Chemin de L'Orme 
69280 MARCY L'ETOILE 
FRANCE 


1 1 This person is also inventor. 


Telephone No. 


Facsimile No. 


Teleprinter No. 


State (that is, country) of nationality: 

FRANCE 


State (that is, country) of residence: 

FRANCE 


This person is ^plicant ( 1 all designated ft-t] all designated States except the i 1 the United States i 1 the States indicated in 

for the purposes of > • States 2S United States of America I I of America only 1 1 the Supplemental Box 


Box No. in FURTHER APPLICANT(S) AND/OR (FURTHER) INVENTOR(S) 


Name and address : (Family name followed by given name; for a legal entity, Jull official 
designation. The address must include postal code and name of country. The country of the address 
indicated in this Box is the applicant's State (that is, country) of residence if no State of residence is 
indicated below.) 

BESEME Fr^d^ric 
39 rue de la Noyera 
38090 VILLEFONTAINE 
FRANCE 


This person is: 

1 1 applicant only 

applicant and inventor 

1 1 inventor only (If this check-box 
is marked, do not fill in below.) 


State (that is, country) of nationality: 

FRANCE 


State (that is, country) of residence: 

FRANCE 


This person is applicant i 1 all designated i — i all designated States except k— 71 the United States 1 — 1 the States indicated in 

for the purposes of ' 1 States 1 1 the United States of America IxnJ of America only 1 1 the Supplemental Box 


Further applicants and/or (further) inventors are indicated on a continuation sheet. 


Box No. IV AGENT OR COMMON REPRESENTATIVE; OR ADDRESS FOR CORRESPONDENCE 


The person identified below is hereby/has been ^pointed to act on behalf 

of the applicant(s) before the competent International Authorities as: agent |^ common representative 


Name and address: (Family name followed by given name; for a legal entity, jull official 

designation. The address must include postal code and name of country.) 

CABINET GERMAIN & MAUREAU 
B.P. 6153 

69466 LYON CEDEX 06 
FRANCE 


Telephone No. 
04 72 69 84 30 


Facsimile No. 
04 72 69 84 31 


Teleprinter No. 
370 391 F 


1 I Address for correspondence: Mark this check-box where no agent or conmion representative is/has been appointed and the 
space above is used instead to indicate a special address to which correspondence should be sent. 
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Sheet No. 2 



R APPLICANT(S) AND/OR (FURTHER) INVENTOR(S) 



If none of the following sub-boxes is used, this sheet should not be included in the request. 


Name and address: (Family name followed by given name; for a legal entity, full official 
designation. The address must include postal code and name of country. The country of the 
address indicated in this Box is the applicant's State (that is, country) of residence if no State 
of residence is indicated below.) 

BLOND Jean-Luc 

75 bis rue des Acqueducs 

69005 LYON 

FRANCE 


This person is: 

applicant only 

applicant and inventor 

1 1 inventor only (If this check-box 
is marked, do not fill in below.) 


State (that is, country) of nationality: 
FRANCE 


State (that is, country) of residence: 
FRANCE 


This person is applicant i ■ all designated | — . all designated States except the United States of . — . the States indicated in 

for the purposes of: 1 1 States | | the United States of America America only | | the Supplemental Box 


Name and address: (Family name followed by given name; for a legal entity, Jull official 
designation. The address must include postal code and name of country. The country of the 
address indicated in this Box is the applicant's State (that is, country) of residence if no State 
of residence is indicated below.) 

BOUTON Olivier 
48 Avenue du Chiter 
69340 FRANCHEVILLE 
FRANCE 


This person is: 

[ 1 applicant only 

applicant and inventor 

1 1 inventor only (If this check-box 
is marked, do not fill in below.) 


State (that is, country) of nationality: FRANCE 


State (that is, country) of residence: FRANCE 


This person is applicant < . all designated . . all designated States except the United States of . . the States indicated in 

'for the purposes of: 1 1 States | | the United States of America America only | | the Supplemental Box 


Name and address: (Family name followed by given name; for a legal entity, Jull official 
designation. The address must include postal code and name of country. The country of the 
address indicated in this Box is the applicant's State (that is, country) of residence if no State 
of residence is indicated below.) 

MANDRAND Bernard 
21 re de la Doua 
69100 VILLEURBANNE 
FRANCE 


This person is: 

1 1 applicant only 

applicant and inventor 

1 1 inventor only (If this check-box 
is marked, do not fill in below.) 


State (that is, country) of nationality: FRANCE 


State (that is, country) of residence: FRANCE 


This person is applicant < i all designated . . all designated States except the United States . . the States indicated in 

for the purposes of: 1 1 States | | the United States of America P\l of America only | | the Supplemental Box 


Name and address: (Family name followed by given name; for a legal entity, jull official 
designation. The address must include postal code and ruime of country. The country of the 
address indicated in this Box is the applicant's State (that is, country) of residence if no State 
of residence is indicated below.) 

N4ALLET Fran9ois 
84 rue Anatole France 
69100 VILLEURBANNE 
FRANCE 


This person is: 

1 1 applicant only 

applicant and inventor 

1 1 inventor only (If this check-box 
is marked, do not fill in below.) 


State (that is, country) of nationality: FRANCE 


State (that is, country) of residence: FRANCE 


This person is applicant , — • all designated . — . all designated States except the United States , — . the States indicated in 
for the purposes of: 1 1 States | | the United States of America |2Sl of America only | | the Supplemental Box 


I [ Further applicants and/or (ftirther) inventors are indicated on another continuation sheet. 
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Box No. V DESIGNATION OF S 



Sheet No. 3 



The following designations are hereby made under Rule 4.9(a) (mark the applicable check-boxes; at least one must be marked): 
Regional Patent 

^ AP ARIPO Patent: GH Oiana, GM Gambia, KE Kenya, LS Lesotho, MW Malawi, SD Suda^ 

UG Uganda, ZW Zimbabwe, and any other State which is a Contracting State of the Harare Protocol and of the PCT 

g| EA Eurasian Patent: AM Armenia, AZ Azerbaijan, BY Belarus, KG Kyrgyzstan, KZ Kazakhstan, MD Republic of 
Moldova, RU Russian Federation, TJ Tajikistan, TM Turkmenistan, and any other State which is a Contracting State 
of the Eurasian Patent Convention and of the PCT 
EP European Patent: AT Austria, BE Belgium, CH and LI Switzerland and Liechtenstein, CY Cyprus, DE Germany, 
DK Denmark, ES Spain, FX Finland, FR France, GB United Kingdom, GR Greece, IE Ireland, IT Italy, LU Luxembourg, 
MC Monaco, NL Netherlands, PT Portugal, SE Sweden, and any other State which is a Contracting State of the European 
Patent Convention and of the PCT 

^ OA OAPI Patent: BF Buricina Faso, BJ Benin, CF Central African Republic, CG Congo, CI Cote d'lvoire, CM Cameroon, 
GA Gabon, GN Guinea, ML Mali, MR Mauritania, NE Niger, SN Senegal, TD Chad, TG Togo, and any other State 
which is a member State of OAPI and a Contracting State of the PCT (if other kind of protection or treatment desired, 
specify on dotted line) 

National Patent (if other kind of protection or treatment desired, specify on dotted line): 

LR Liberia 

^ LS Lesotho 

13 LT Lithuania 

13 LU Luxembourg 

(3 LV Latvia 

^ MD Republic of Moldova 

^ MG Madagascar 

^ MK The former Yugoslav Republic of Macedonia 



13 AL Albania 

(3 AM Armenia 

g| AT Austria 

13 AU Australia 

AZ Azerbaijan 

^ BA Bosnia and Herzegovina 

^ BB Barbados 

^ BG Bulgaria 

13 BR Brazil 

13 BY Belarus 

g| CA Canada 

^ CH and LI Switzerland and Liechtenstein 

^ CN China 

^ CU Cuba 

^ CZ Czech Republic 

^ DE Germany 

^ DK Denmark 

^ EE Estonia 

^ ES Spain 

^ FI Finland 

^ GB United Kingdom 



^ GE Georgia.... 

^ GH Ghana 

^ GM Gambia 

^ HR Croatia 

^ HU Hungary... 

^ ID Indonesia 

^ IL Israel 



S MN 

^ MW 

S MX 

^ NO 

^ NZ 

S PL 

S PT 

^ RO 

S RU 

S SD 

El SE 

S SG 

S SI 

S SK 

S SL 

S TJ 

^ TM 

S TR 

S UA 

13 UG 

^ US 



Mongolia 

Malawi 

Mexico 

Norway 

New Zealand 

Poland 

Portugal , 

Romania 

Russian Federation 

Sudan 

Sweden 

Singapore 

Slovenia 

Slovakia 

Sierra Leone 

Tajikistan 

Turkmenistan 

Turkey 

Trinidad and Tobago 

Ukraine 

Uganda 

United States of America . 



^ IS Iceland 

g| JP Japan 

g| KE Kenya 

^ KG Kyrgyzstan 

^ KP Democratic People's Republic of Korea . 



^ UZ Uzbekistan.. 
^ VN Viet Nam.... 
g| YU Yugoslavia.. 



lEI 
lEI 

lEI 



KR Republ ic of Korea . 

KZ Kazakhstan 

LC Saint Lucia 

LK Sri Lanka 



^ ZW Zimbabwe 

Check-boxes reserved for designating States which have 
become party to the PCT after issuance of this sheet: 

□ 

□ 



Precautionary Designation Statement: In addition to the designations made above, the applicant also makes under Rule 4.9(b) all 
other designations which would be permitted under the PCT except the designation(s) indicated in the Supplemental Box as being 
excluded from the scope of this statement. The applicant declares that those additional designations are subject to confirmation and 
that any designation which is not confirmed before the expiration of 1 5 months from the priority date is to be regarded as withdrawn 
by the applicant at the expiration of that time limit. (Confirmation of a designation consists of the filing of a notice specifying that designation 
and the payment of the designation and confirmation fees. Confirmation must reach the receiving Office within the 1 5 -month time limit.) 
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Sheet No. 4 



Filing date 
of earlier application 
(day/month/year) 


Number 
of earlier application 


Where earlier application is: 


national application: 
country 


regional appiicaiion. 
regional Office 


international application: 
receiving Office 


item (1) 

7 July 1997 
(07/07/97) 


97 08815 








item (2) 










item (3) 











Box No. VI PRIORITY CLAIM 



I [ Further priority claims are indicated in the Supplemental Box. 



The receiving Office is requested to prepare and transmit to the International Bureau a certified copy of the earlier 
application(s) {only if the earlier application was filed with the Office which for the purposes of the present international 
application is the receiving Office) identified above as item(s): (TJ 

♦ Where the earlier application is an ARIPO application, it is mandatory to indicate in the Supplemental Box at least one country party to the 
Paris Convention for the Protection of Industrial Property for which that earlier application was filed (Rule 4. IO(b)(ii)). See Supplemental Box, 



Box No, VII INTERNATIONAL SEARCHING AUTHORITY 



Choice of International Searching Authority (ISA) 

(if two or more International Searching Authorities are 
competent to carry out the international search, indicate 
the Authority chosen; the two-letter code may be used): 

ISA /EP 



Request to use results of earlier search: reference to that search {if an earlier 
search has been carried out by or requested from the International Searching 
Authority): 



Date (day/month/year) 
19 June 1998 



Number Country (or regional Office) 

FA 546253 FRANCE 



Box No. VIII CHECK LIST; LANGUAGE OF FILING 



This international application contains 
the following number of sheets: 

recjuest :4 
description (excluding 
sequence listing part) 

claims 



abstract 
drawings 

sequence listing part 
of description 



33 
4 
1 
9 

:52 



Total number of sheets : 103 



This international application is accompanied by the item(s) marked below: 

1 . □ fee calculation sheet 

2. □ separate signed power of attorney 

3. ^ copy of general power of attorney; reference number, if any: 

4. □ statement explaining lack of signature 

5. □ priority document(s) identified in Box No. VI as item(s): 

6. □ translation of international application into (language): 

7. □ separate indications concerning deposited microorganism or other biological material 

8. H nucleotide and/or amino acid sequence listing in computer readable form 

9. ^ oth^T {specify): Copy of Search Report 



Figure of the drawings which 
should accompany the abstract: 


Language of filing of the 

international application: French 


Box No. IX SIGNATURE OF APPLICANT OR AGENT 



Next to each signature, indicate the name of the person signing and the capacity in which the person signs (if such capacity is not obvious from 
reading the request). 

CABINET GERMAIN & MAUREAU 



Dominique GUERRE 

CPI 92 1 1 04 Lyon, July 6, 1 998 



FoMjeceivin^Offic^js^nl^ 



1 . Date of actual receipt of the purported 
international application: 


2. 


Drawings: 


3. 


Corrected date of actual receipt due to later but 
timely received papers or drawings completing 
the purported international application: 






□ 


received: 


4. 


Date of timely receipt of the required corrections 
under PCT Article 11(2): 






□ 


not received: 


5. 


International Searching Authority 

(if two or more are competent): ISA / 


6- □ 


Transmittal of search copy delayed 
until search fee is paid 







For International Bureau use only 



Date of receipt of the record copy 
by the International Bureau: 



Form PCT/RO/101 (last sheet) (July 1998) 



See Notes to the request form 
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